我正在使用此项目:https://github.com/lucidworks/hadoop-solr 有人知道正在处理的文档的名称(或路径)保存在哪个值中吗。我想将这个值检索到solr admin(在我的模式中添加一个名为的字段)。这可能吗?
example:i want 以查看文档的名称,查询将从中返回相同的结果。
我正在使用以下命令运行项目:
hadoop jar solr-hadoop-job-2.2.5.jar
com.lucidworks.hadoop.ingest.IngestJob
-Dlww.commit.on.close=true -DcsvDelimiter=
-cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c spyros1
- i /usr/local/hadoop/input
-of com.lucidworks.hadoop.io.LWMapRedOutputFormat
-s http://127.0.1.1:8983/solr
2条答案
按热度按时间c8ib6hqw1#
这对我有用:
更多信息请参见此。
lskq00tm2#
对于
CSVIngestMapper
文件路径当前未添加到任何solr字段。请随意在回购中创建一个问题。https://github.com/lucidworks/hadoop-solr
也欢迎prs
编辑:(参见https://github.com/lucidworks/hadoop-solr/issues/16 (对于解决方案)