anything-llm [FEAT] PDF解析中的视觉支持

o8x7eapl  于 3个月前  发布在  其他
关注(0)|答案(2)|浏览(73)

如果知识库包含图像材料或包含图像信息的PDF文件,目前是否不支持?未来是否会支持OCR识别技术对图像的支持?如果是的话,预计何时可以实现?谢谢。

7cwmlq89

7cwmlq891#

我们目前没有时间表或计划来实现对带有文本和图像的PDF进行完整的OCR扫描,除非它可以在不考虑示例选择的模型的情况下完成。并非所有的模型提供商都支持某种形式的视觉,即使如此,我们也不会使用LLM来解析PDF文本。
将标记为功能请求

66bbxpm5

66bbxpm52#

可以允许插入Azure文档智能的API密钥吗?甚至可以插入GPT4o...

相关问题