ragflow [问题]:文件无法解析,一直卡在解析中,甚至一两天内没有任何变化,

lnlaulya  于 6个月前  发布在  其他
关注(0)|答案(9)|浏览(401)

描述你的问题

我在网页上选择相应的知识库,上传多个PDF文件,开始一个或多个文件解析,经常卡在解析过程中(一两天内没有变化),打开后台日志,循环以下错误和警告信息,请帮忙定位具体问题,谢谢!

bkhjykvo

bkhjykvo1#

循环警告和错误信息:
[WARNING] [2024-06-07 03:15:36,354] [synonym.init] [line:24]:由于没有Redis连接,实时同义词被禁用。
[WARNING] Load term.freq FAIL!
Traceback (most recent call last):
File "/ragflow/rag/svr/task_executor.py", line 375, in main()
main()
File "/ragflow/rag/svr/task_executor.py", line 294, in main
rows = collect()
File "/ragflow/rag/svr/task_executor.py", line 117, in collect
assert tasks, "{} empty task!".format(msg["id"])
AssertionError: b89fcce8247811ef99fa0242ac120003 empty task!
[WARNING] [2024-06-07 03:15:56,104] [synonym.init] [line:24]:由于没有Redis连接,实时同义词被禁用。
[INFO] [2024-06-07 03:15:56,703] [_internal._log] [line:96]:172.18.0.6 - - [07/Jun/2024 03:15:56] "GET /v1/document/list?kb_id=6529d8601f2311efa1140242ac120006&page=1&page_size=10 HTTP/1.1" 200 -
[WARNING] Load term.freq FAIL!
Traceback (most recent call last):
File "/ragflow/rag/svr/task_executor.py", line 375, in main()
main()
File "/ragflow/rag/svr/task_executor.py", line 294, in main
rows = collect()
File "/ragflow/rag/svr/task_executor.py", line 117, in collect
assert tasks, "{} empty task!".format(msg["id"])
AssertionError: b89fcd4c247811ef99fa0242ac120003 empty task!
[WARNING] [2024-06-07 03:16:16,005] [synonym.init] [line:24]:由于没有Redis连接,实时同义词被禁用。

juzqafwq

juzqafwq2#

循环警告和错误信息:
[警告] [2024-06-07 03:15:36,354] [synonym.init] [行号:24]:实时同义词被禁用,因为没有redis连接。
[警告] Load term.freq失败!回溯(最近一次调用):文件"/ragflow/rag/svr/task_executor.py",第375行,main()函数中文件"/ragflow/rag/svr/task_executor.py",第294行,main()函数中rows = collect()文件"/ragflow/rag/svr/task_executor.py",第117行,collect()函数中assert tasks, "{} empty task!".format(msg["id"])AssertionError: b89fcce8247811ef99fa0242ac120003 empty task!
[警告] [2024-06-07 03:15:56,104] [synonym.init] [行号:24]:实时同义词被禁用,因为没有redis连接。
[信息] [2024-06-07 03:15:56,703] [_internal._log] [行号:96]:172.18.0.6 - - [07/Jun/2024 03:15:56] "GET /v1/document/list?kb_id=6529d8601f2311efa1140242ac120006&page=1&page_size=10 HTTP/1.1" 200 - [警告] Load term.freq失败!回溯(最近一次调用):文件"/ragflow/rag/svr/task_executor.py",第375行,main()函数中文件"/ragflow/rag/svr/task_executor.py",第294行,main()函数中rows = collect()文件"/ragflow/rag/svr/task_executor.py",第117行,collect()函数中assert tasks, "{} empty task!".format(msg["id"])AssertionError: b89fcd4c247811ef99fa0242ac120003 empty task!
[警告] [2024-06-07 03:16:16,005] [synonym.init] [行号:24]:实时同义词被禁用,因为没有redis连接。
当在重启ragflow后数据变得脏时会发生这种情况。忽略它们,并在网页上取消任务。

au9on6nz

au9on6nz3#

描述你的问题

我在网页上选择相应的知识库,上传多个PDF文件,开始一个或多个文件解析,经常会出现卡在解析中(一两天内没有变化),打开后台日志,循环以下错误和警告信息,请帮忙定位具体问题,谢谢!
如果进度条在开始时5秒钟内没有变化,系统一定出了问题。
你可以取消并重做。
通常情况下,如果只使用CPU进行嵌入和索引,这个过程会非常慢。

mbskvtky

mbskvtky4#

1、在docker目录下的docker-compose.yml配置文件中指定了使用两个GPU资源A10

deploy:
  resources:
    reservations:
      devices:
        - driver: nvidia
          device_ids: ['0','1']
          capabilities: [gpu]

2、查看网页解析进度条(进度40.91%,已体验约5小时,长时间未变化)提示信息,发现以下循环错误:

Page(8597): [ERROR]Embedding error:Account abnormal. Please ensure it's on good standing.
Page(97109): [ERROR]Embedding error:Account abnormal. Please ensure it's on good standing.
1u4esq0p

1u4esq0p5#

1、在docker目录下的docker-compose.yml配置文件中指定了使用两个GPU资源A10进行部署:

deploy:
  resources:
    reservations:
      devices:
        - driver: nvidia
          device_ids: ['0', '1']
          capabilities: [gpu]

2、查看网页解析进度条(进度40.91%,已体验约5小时,长时间未变化)提示信息,发现以下循环错误:

Page(8597): [ERROR]嵌入错误:帐户异常。请确保其处于良好状态。
Page(97109): [ERROR]嵌入错误:帐户异常。请确保其处于良好状态。

请检查您选择的嵌入状态。如果是基于SaaS的,您需要在系统设置中设置API密钥。
kadbb459

kadbb4596#

我已经配置了LLM工厂(service_conf.yaml:user_default_llm, ali:Tongyi-Qianwen)和相应的api_key。

r8uurelv

r8uurelv7#

你解决了这个问题吗?我也遇到了同样的问题。

idfiyjo8

idfiyjo89#

我已经配置了LLM工厂(service_conf.yaml:user_default_llm, ali:Tongyi-Qianwen)和相应的api_key。更改user_default_llm后,它仅对新注册用户有效。

相关问题