solr数据导入处理程序是否有办法从rdbms获取元数据,并从tika获取相关文件内容?

crcmnpdw  于 2021-10-10  发布在  Java
关注(0)|答案(0)|浏览(238)

我打算使用solr的数据导入处理程序从rdbms记录创建文档。rdbms列之一是pdf/word文件路径。我想做的是用tika解析文件,并将结果保存在上述文档的另一个字段中。我的最终文档应在同一文档中包含rdbms和tika导入的数据。
例如
数据库中的文档字段:作者、发布年份、电子邮件
tika中的文档字段:纯文本
这是否可以作为数据导入处理程序中的一种配置,或者我应该单独导入数据处理程序(sql和tika作为单独的文档类型),然后从查询中进行连接?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题