anything-llm [FEAT]: 使用系统文件夹作为RAG的知识库

qq24tv8q  于 4个月前  发布在  其他
关注(0)|答案(2)|浏览(80)

你想看到什么?
我正在利用Anything LLM作为一个知识助手来讨论业务流程并分享我的见解,这些见解我会定期记录在文档中。然而,我面临着一个挑战,那就是保持系统与这些文件的不断演变相适应,因为它们不是静态文档。
我的理想解决方案将是一个RAG系统,它能让我:

  1. 直接从计算机上指定文件夹(可能还有子文件夹)中的一组文件中获取答案。为了避免扫描、拆分和在子文件夹中嵌入不必要的文件,我希望能够指定文件扩展名过滤器。
  2. 自动检测文档的更改,并在预定的时间间隔内或在认为必要时重建矢量数据库。
  3. 确保矢量数据库更新发生在内存中,在后台进行,不会干扰代理的使用,直到新的上下文数据可用。一旦新的嵌入和索引完成,这将使Anything LLM减少锁定系统以供使用的时间,只需将其序列化到矢量数据库的更改时间和将新的矢量数据库加载到内存以供代理操作的时间。
    实现这个功能将显著提高Anything LLM在我预期的使用案例中的适用性。此外,我对该项目的进展印象深刻,并打算不时地为其提供财务支持。
bzzcjhmw

bzzcjhmw1#

这是正确的目标。添加、跟踪、更新文件是一个真正的问题。指向一个文件夹/子文件夹绝对会是这个美妙的技术的下一个级别的增强。

jgzswidk

jgzswidk2#

如果有人正在观看这个,远程文件的实时文件同步(如web、Github等)已经在beta https://docs.useanything.com/beta-preview/active-features/live-document-sync中“实时”运行,并且即将合并的分支desktop-local-file-sync将扩展到任何本地上传的文件,仅限桌面。
权限使我们无法使用本地文件进行自我托管,显然远程托管示例也是如此。因此,本地文件同步仅在桌面上进行。

相关问题