面向RAG的Azure OpenAI认知搜索数据架构

xe55xuns  于 12个月前  发布在  其他
关注(0)|答案(1)|浏览(145)

我想知道是否有人可以建议用各种数据构建索引的最佳方法,并在OpenAI中最有效地使用它
想象一下,我们需要支持存储两种类型的内容,一方面我们有文章
1.发布日期
1.标题
1.作者
1.内容-10,000字内容
另一方面,我们有一个带有属性的事件会话/演示:
1.事件名称
1.活动/演讲题目
1.发言人(每个发言人都有姓名、职务和公司)
1.会议记录,基本上与文章内容相同,一堆句子
所有这些都需要存储在一个索引中。
我的问题是如何使用RAG模式构建索引,最相关的内容,以便Open AI可以给予最相关的答案
1.演讲者是Xyx的会议的前5个要点(Azure搜索应返回会议内容作为最相关的结果)

  1. XYZ撰写的最新文章前5名
    1.给予我什么是围绕XYZ主题(苹果m3芯片),这可以在一些文章或会议中提到
    处理这一问题的最佳方法是什么?
    谢谢
l3zydbqr

l3zydbqr1#

创建一个包含Title、Content、Keywords和Url的索引。将这些属性Map到我们的语义配置。
尽可能将源内容Map到此模型。事件名称和标题是标题。大段文本Map到内容(抄本或内容)。演讲者、主题、
添加您可能需要的任何其他属性到索引中。但是,这些属性不会成为RAG设置的一部分。
使用SDK推送内容。这使得在索引内容之前丰富/修改/Map内容变得微不足道。如果使用内置连接器,您仍然可以Map和丰富内容,但很难开发,维护和调试。

相关问题