我正在使用nutch抓取站点数据,然后将数据写入hbase。问题是,在教程中提到了如何更新特定行(put),而不是如何用java代码创建。如何在爬网时创建行,“行号”将递增?
tuwxkamq1#
我有主意了。如果有人感兴趣:使用数据的任何唯一值作为“键”。例如,我必须处理书籍,所以我的行“number”将是唯一的isbn代码。
1条答案
按热度按时间tuwxkamq1#
我有主意了。如果有人感兴趣:使用数据的任何唯一值作为“键”。例如,我必须处理书籍,所以我的行“number”将是唯一的isbn代码。