ragflow [Bug]:无法解析ppt和pptx文件(未丢失*.so)

yrwegjxp  于 4个月前  发布在  其他
关注(0)|答案(2)|浏览(125)

是否存在相同错误的现有问题?

  • 我已检查了现有的问题。

分支名称

main

提交ID

8d667d5

其他环境信息

  • 无响应*

实际行为

从docker初始化服务器,然后上传ppt文件,然后尝试解析,得到错误。
.pdf是正常的。
.ppt得到:[ERROR]内部服务器错误:文件不是zip文件。
.pptx得到:[ERROR]内部服务器错误:不支持的操作数类型(s)对于//:NoneType和int。

预期行为

  • 无响应*

重现步骤

git clone main
then init docker and upload ppt

其他信息

  • 无响应*
js4nwp54

js4nwp541#

是否存在相同错误的现有问题?

  • 我已检查了现有的问题。

分支名称

main

提交ID

8d667d5

其他环境信息

  • 无响应*

实际行为

从docker初始化服务器,然后上传ppt文件,然后尝试解析,得到错误。.pdf是正常的,.ppt得到:ERROR]内部服务器错误:文件不是zip文件。.pptx得到:[ERROR]内部服务器错误:不支持的操作数类型(对于//):NoneType和int

预期行为

  • 无响应*

重现步骤

git clone main
then init docker and upload ppt

其他信息

  • 无响应*

无法重现

kiz8lqtg

kiz8lqtg2#

相同的问题。

当我使用README提供的方法设置Ragflow时,没有发生变化。
当我上传一个pptx文件时,解析显示错误。

这是服务器的日志:
Traceback (most recent call last):
File "/ragflow/rag/svr/task_executor.py", line 146, in build
cks = chunker.chunk(row["name"], binary=binary, from_page=row["from_page"],
File "/ragflow/rag/app/presentation.py", line 105, in chunk
for pn, (txt, img) in enumerate(ppt_parser(
File "/ragflow/rag/app/presentation.py", line 27, in call
txts = super().call(fnm, from_page, to_page)
File "/ragflow/deepdoc/parser/ppt_parser.py", line 54, in call
for shape in sorted(
File "/ragflow/deepdoc/parser/ppt_parser.py", line 55, in
slide.shapes, key=lambda x: (x.top // 10, x.left)):
TypeError: unsupported operand type(s) for //: 'NoneType' and 'int'
我的电脑是i7-12600 + 64RAM + 4060Ti 16G,Ubuntu Server已经安装好,Docker和其他容器都运行良好。

相关问题