**结束。**此问题需要详细的调试信息。它目前不接受答案。
**想改进这个问题吗?**更新问题,使其成为堆栈溢出的主题。
6年前关门了。
改进这个问题
我运行的是ubuntu14.04,我正准备让一个基本的nutch网络爬网运行,但没有结果。在本教程之后,我设置了以下构建块:
ubuntu 14.04版
hbase 0.90.4版
坚果2.2.1
解决方案4.3.1
如果确认hbase和solr都在运行,则填充 urls/seed.txt
文件。当我打电话的时候;
bin/nutch inject urls
我看到了下面的输出,然后看起来nutch挂起了。
InjectorJob: starting at 2014-06-09 23:38:49
InjectorJob: Injecting urlDir: urls/seed.txt
这个stackoverflow问题似乎与我的相似,但我并不支持代理,因此答案不适用。
如能帮助解决这个问题,我们将不胜感激。
1条答案
按热度按时间f8rj6qna1#
ubuntu将hosts中的环回ip地址默认为127.0.1.1。hbase(根据本页)要求环回ip地址为127.0.0.1。
ubuntu
/etc/hosts
默认情况下,文件包含(mycomputername是您的计算机名):使用
sudo gedit /etc/hosts
按以下步骤更新主机文件:重新启动ubuntu。nutch应该不会再在将url注入hbase时遇到麻烦了。