“hadoop solr lucidworks项目”检索输入名称路径

eoigrqb6  于 2021-06-02  发布在  Hadoop
关注(0)|答案(2)|浏览(301)

我正在使用此项目:https://github.com/lucidworks/hadoop-solr 有人知道正在处理的文档的名称(或路径)保存在哪个值中吗。我想将这个值检索到solr admin(在我的模式中添加一个名为的字段)。这可能吗?
example:i want 以查看文档的名称,查询将从中返回相同的结果。
我正在使用以下命令运行项目:

hadoop jar solr-hadoop-job-2.2.5.jar 
    com.lucidworks.hadoop.ingest.IngestJob  
    -Dlww.commit.on.close=true -DcsvDelimiter= 
   -cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c spyros1  
    - i  /usr/local/hadoop/input 
    -of com.lucidworks.hadoop.io.LWMapRedOutputFormat 
    -s http://127.0.1.1:8983/solr
c8ib6hqw

c8ib6hqw1#

这对我有用:

hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob  
    -Dlww.commit.on.close=true 
    -Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="\\w+" 
   -Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=match_ss  
   -cls com.lucidworks.hadoop.ingest.RegexIngestMapper  
   -c collection1 -i /path/* -s http://127.0.1.1:8983/solr
   -of com.lucidworks.hadoop.io.LWMapRedOutputFormat

更多信息请参见此。

lskq00tm

lskq00tm2#

对于 CSVIngestMapper 文件路径当前未添加到任何solr字段。
请随意在回购中创建一个问题。https://github.com/lucidworks/hadoop-solr
也欢迎prs
编辑:(参见https://github.com/lucidworks/hadoop-solr/issues/16 (对于解决方案)

相关问题