[Feature Request]Using Ragflow for Document Preprocessing with custom chunking strategies

kpbwa7wx  于 6个月前  发布在  其他
关注(0)|答案(1)|浏览(106)

描述你的问题

你好,

我目前正在进行一个项目,其中文档分块的方式对于特定的任务至关重要。例如,在字典中,将文本分割成单词-解释对是有用的。

我对使用ragflow进行项目的预处理阶段感兴趣。具体来说,我想了解:

  1. ragflow是否可以配置为执行自定义文档分块?例如,它是否可以根据特定于正在处理的内容的分隔符或结构模式来分割文档?
  2. 是否可能仅使用raflow用于预处理数据的目的,在那里我可以指定如何分块文档?
    我希望有一个工具,可以预处理我的文档并向我展示如何创建块。将其标记在文档上,这样我就可以看到文档是如何分段的,如果有必要,只需标记一个较小或较大的文本区域即可更改它。
    非常感谢

## 描述你的问题

你好,

我目前正在进行一个项目,其中文档分块的方式对于特定的任务至关重要。例如,在字典中,将文本分割成单词-解释对是有用的。

我对使用ragflow进行项目的预处理阶段感兴趣。具体来说,我想了解:
1. ragflow是否可以配置为执行自定义文档分块?例如,它是否可以根据特定于正在处理的内容的分隔符或结构模式来分割文档?
1. 是否可能仅使用raflow用于预处理数据的目的,在那里我可以指定如何分块文档?
我希望有一个工具,可以预处理我的文档并向我展示如何创建块。将其标记在文档上,这样我就可以看到文档是如何分段的,如果有必要,只需标记一个较小或较大的文本区域即可更改它。
非常感谢
2nc8po8w

2nc8po8w1#

你好,

  1. 目前,ragflow无法采用自定义的分块方法。但根据某些模式,这并不是一个难以实现的要求。也许我们稍后可以提供这个功能。
  2. 我们将为此目的提供API,通过API提供分块结果。

相关问题