我安装了ApacheNutch2.3、Solr4.8和HBase0.9,爬网并获取了内容。我想根据标题数据、html标记、标记类名或标记id对爬网内容进行索引,或者以这样的方式进行爬网,以便轻松获取内容标题数据、html标记、标记类名或标记id。请帮帮我。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!