我们的另一个Azure OpenAI解决方案,结合Azure文档智能,在处理包含图表和表格的PDF文件时表现良好,能够从这些元素中准确提取数据。然而,在使用Anything LLM时,它经常显示表格/图表信息未提供。你能建议一种利用Azure文档智能来增强索引和解析能力的方法吗?
x8diyxa71#
这个服务是Azure在内置的文档聊天之外提供的吗?如果是,那么我们可能可以利用它。否则,我们不进行OCR/视觉PDF图像或聊天,这就是为什么数据不会被引用,因为不是每个LLM都是多模态的——对于那些不使用这些类型模型的人来说,完全转录/字幕化是不可行的。
vdzxcuhz2#
你好,Timothy Carambat,
感谢你的回复。是的,Azure 文档智能(DI)是一个独立的服务,可以用于提供文档加载器和分块功能。请在下面找到一个使用 DI 的 RAG 示例。
2条答案
按热度按时间x8diyxa71#
这个服务是Azure在内置的文档聊天之外提供的吗?如果是,那么我们可能可以利用它。否则,我们不进行OCR/视觉PDF图像或聊天,这就是为什么数据不会被引用,因为不是每个LLM都是多模态的——对于那些不使用这些类型模型的人来说,完全转录/字幕化是不可行的。
vdzxcuhz2#
你好,Timothy Carambat,
感谢你的回复。是的,Azure 文档智能(DI)是一个独立的服务,可以用于提供文档加载器和分块功能。请在下面找到一个使用 DI 的 RAG 示例。