我正在做一个索引PDF文档的项目(现在主要是PDF)。我发现ElasticSearch可以使用Apache Tika索引附加文档。
我已经实现了ElasticSearch,索引了一些PDF文档,并使用PHP作为客户端来呈现ElasticSearch返回的查询结果。
如果我能得到一些教程的链接,就如何从ElasticSearch返回的查询结果中找到附加到ElasticSearch的PDF,我将不胜感激。
我在网上搜索了一下,找不到任何关于我想实现的目标的教程
我正在做一个索引PDF文档的项目(现在主要是PDF)。我发现ElasticSearch可以使用Apache Tika索引附加文档。
我已经实现了ElasticSearch,索引了一些PDF文档,并使用PHP作为客户端来呈现ElasticSearch返回的查询结果。
如果我能得到一些教程的链接,就如何从ElasticSearch返回的查询结果中找到附加到ElasticSearch的PDF,我将不胜感激。
我在网上搜索了一下,找不到任何关于我想实现的目标的教程
2条答案
按热度按时间s6fujrry1#
在documentation中,它说Elasticseacrh将附件的内容存储为base64编码。所以在您搜索之后,您可以再次获得base64编码的文档内容。然后您可以将该内容解码为pdf。例如,检查该线程以了解如何完成:PHP get pdf file from base64 encoded data string
kupeojn62#
首先,我降落在这里,然后我注意到,事情已经发生了很大的变化,同时使事情变得更加灵活和容易。关键是Kibana。如何做到这一点,现在是例如描述在https://www.elastic.co/guide/en/kibana/current/automating-report-generation.html