doccano 导出数据集耗时过长或无法完成,请帮忙,

kqlmhetl  于 6个月前  发布在  其他
关注(0)|答案(3)|浏览(51)

根据您的描述,您在尝试导出数据集时遇到了问题。您可以尝试以下方法来解决这个问题:

  1. 首先,确保您的Doccano容器正在运行。您可以使用以下命令检查容器的状态:
docker ps -a

如果您看到名为docker_backend_1的容器正在运行,那么您可以继续下一步。如果没有,请使用以下命令启动它:

docker start docker_backend_1
  1. 然后,您需要进入Doccano容器并执行导出任务。您可以使用以下命令做到这一点:
docker exec -it docker_backend_1 /bin/bash

这将打开一个新的终端窗口,您可以在其中输入以下命令来执行导出任务:

doccano task export --dataset_id=<your_dataset_id> --output_path=<your_output_path>

请将<your_dataset_id>替换为您要导出的数据的ID,将<your_output_path>替换为您希望将导出文件保存到的路径。

  1. 如果上述方法仍然无法解决问题,您可以尝试使用timeout命令来限制Doccano任务的执行时间。例如,您可以使用以下命令在5分钟后终止任务:
timeout 5m doccano task export --dataset_id=<your_dataset_id> --output_path=<your_output_path>

如果任务在5分钟内未完成,它将被终止。请注意,这种方法可能会导致部分数据丢失,因为任务可能在超时之前未能完成。

flmtquvp

flmtquvp1#

如果你可以访问数据库容器,你可以导出所有数据。

qxgroojn

qxgroojn2#

嘿,@Hironsan,感谢你回复我!是的,我们正在采取这种方法作为解决办法,然而,在尝试操作Doccano时,我们遇到了挑战。我们无法调用API或执行数据下载/上传操作。你能提供任何指导或建议来帮助我们解决这个问题吗?
非常感谢你的帮助!

hwazgwia

hwazgwia3#

你好,我在在vanilla ubuntu上安装doccano时遇到了相同的问题。在使用conda create -n doccano python=3.11创建conda环境后,激活(conda activate doccano)并使用pip安装doccano后,问题消失了。

祝好运

相关问题