llama_index [Feature Request]: Async / parallel SemanticSplitterNodeParser

dauxcl2d 于 10个月前发布在其他

关注(0)|答案(3)|浏览(87)

功能描述

我希望有一个异步版本的SemanticSplitterNodeParser,因为目前每个节点的嵌入都是同步生成的，当一个文档有200-300个嵌入时，它的运行速度非常慢。

原因

我尝试使用IngestionPipeline,但不幸的是，这并不能提高速度。

功能价值

无响应*

来源：https://github.com/run-llama/llama_index/issues/11025

3条答案

按热度按时间

🤖*

看起来你已经掌控了局面，如果你需要帮助或者有特定的问题，请告诉我我能为你做些什么！

关于Dosu

这个回复的目的是提供有用的信息并节省你的时间。它不是精确的解决方案,而是一个你自己研究的起点。
帮助我变得更有用！如果这有帮助，请留下一个👍；如果不相关，请留下一个👎。
如果你想继续对话，请以@dosu-bot开头回复。

赞(0）回复(0）举报 10个月前

你提到在SemanticSplitterNodeParser上并行化IngestionPipeline时没有观察到加速效果。你能分享一下代码片段吗？因为我无法运行它，我得到了以下错误：
无法pickle本地对象'split_by_sentence_tokenizer..split'。我查看了源代码，发现split方法是在split_by_sentence_tokenizer内部局部定义的，因此无法访问多进程，这很奇怪。有人能建议一个解决方法/应对措施吗？@logan-markewich

赞(0）回复(0）举报 10个月前

你好，有人找到解决pickle问题的方法了吗？
我不确定如何解决pickle问题。
任何帮助都将非常感谢@dosu-bot 。

赞(0）回复(0）举报 10个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 9个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 9个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 9个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 9个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 9个月前