我想知道是否有人可以建议用各种数据构建索引的最佳方法,并在OpenAI中最有效地使用它
想象一下,我们需要支持存储两种类型的内容,一方面我们有文章,
1.发布日期
1.标题
1.作者
1.内容-10,000字内容
另一方面,我们有一个带有属性的事件会话/演示:
1.事件名称
1.活动/演讲题目
1.发言人(每个发言人都有姓名、职务和公司)
1.会议记录,基本上与文章内容相同,一堆句子
所有这些都需要存储在一个索引中。
我的问题是如何使用RAG模式构建索引,最相关的内容,以便Open AI可以给予最相关的答案
1.演讲者是Xyx的会议的前5个要点(Azure搜索应返回会议内容作为最相关的结果)
- XYZ撰写的最新文章前5名
1.给予我什么是围绕XYZ主题(苹果m3芯片),这可以在一些文章或会议中提到
处理这一问题的最佳方法是什么?
谢谢
1条答案
按热度按时间l3zydbqr1#
创建一个包含Title、Content、Keywords和Url的索引。将这些属性Map到我们的语义配置。
尽可能将源内容Map到此模型。事件名称和标题是标题。大段文本Map到内容(抄本或内容)。演讲者、主题、
添加您可能需要的任何其他属性到索引中。但是,这些属性不会成为RAG设置的一部分。
使用SDK推送内容。这使得在索引内容之前丰富/修改/Map内容变得微不足道。如果使用内置连接器,您仍然可以Map和丰富内容,但很难开发,维护和调试。