如何在安装在伪分布式模式下的hadoop中运行nutch

sczxawaw 于 2021-05-29 发布在 Hadoop

关注(0)|答案(1)|浏览(294)

我的ubuntu上安装了nutch1.13。我可以在独立模式下运行爬网。它成功地运行并产生了预期的结果，但我不知道如何在hadoop中运行它了？我已经在伪分布式模式下安装了hadoop，我想用hadoop运行nutch爬网并监视它。我该怎么做？有很多关于在独立模式下运行它的教程，但是我找不到任何关于如何在hadoop中运行它的明确说明，除了我必须在用ant构建它之后使用“nutch job”。
谢谢你的帮助。

hadoop nutch web-crawler

来源：https://stackoverflow.com/questions/47939958/how-to-run-nutch-in-hadoop-installed-in-pseudo-distributed-mode