将文本拆分为段落

t40tm48m  于 2021-06-02  发布在  Hadoop
关注(0)|答案(0)|浏览(259)

我正在使用此项目:https://github.com/lucidworks/hadoop-solr 我试着把一些文本分成段落,然后搜索单词。但作为回报,我接受了这个词的含义。有可能这样做吗?
我用这个:

hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob 
-Dlww.commit.on.close=true 
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="(?sm)^.*?\.\s*$"  
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=match1_ss
-cls com.lucidworks.hadoop.ingest.RegexIngestMapper -c test2 -i /usr/local/hadoop/input
-s http://127.0.1.1:8983/solr -of com.lucidworks.hadoop.io.LWMapRedOutputFormat

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题