我在amazon web服务上有一台机器,我正在尝试一些搜索功能。我已经在我的aws机器上安装了nutch和hbase。我已经爬过wikipedia.org作为一个例子,爬过的数据存储在hbase的cloud上。我想安装solr并对其进行搜索。我没有将我的系统安装为集群,因为我只是想做一些研究,例如,如何使用它等等。我的问题是hadoop在这个系统中的地位(我还没有安装hadoop)?在我的本地计算机上安装hadoop和solr合乎逻辑吗。另外,我的下一个挑战将是如何与aws计算机通信。
t1qtbnec1#
如果你安装了nutch,你已经有了hadoop,它可以处理你的爬网和解析。您可以将nutch生成的数据推送到solr中进行索引。
1条答案
按热度按时间t1qtbnec1#
如果你安装了nutch,你已经有了hadoop,它可以处理你的爬网和解析。您可以将nutch生成的数据推送到solr中进行索引。