dify 在解析xlsx文件后,超链接丢失,

iyfamqjs  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(26)

自我检查

  • 我已搜索现有问题 search for existing issues(包括已关闭的问题)。
  • 我确认我使用英文提交此报告(我已阅读并同意 Language Policy)。
  • 请务必使用英文提交问题,否则会被关闭。谢谢!:)
  • 请不要修改此模板 :) 并填写所有必需的字段。

1. 此请求是否与您正在经历的挑战有关?请告诉我您的故事。

原始文本如下。

但我得到的是这样的。

2. 附加上下文或评论

希望在解析后超链接不会丢失,并以markdown形式呈现。

3. 你能帮助我们解决这个问题吗?

  • 我对贡献此功能感兴趣。
omhiaaxx

omhiaaxx1#

要保留并在解析XLSX文件后以markdown格式呈现超链接,需要确保在初始化MarkdownExtractor时将remove_hyperlinks标志设置为False。这将防止remove_hyperlinks方法从内容中剥离超链接。
以下是如何初始化MarkdownExtractor以保留超链接的示例:

extractor = MarkdownExtractor(file_path="path_to_your_file.xlsx", remove_hyperlinks=False)
documents = extractor.extract()

通过设置remove_hyperlinks=False,markdown内容中的超链接将被保留。

  • 要继续与Dosu交流,请提及@dosu。*

相关问题