PaddleNLP [问题]:在使用doccano.py脚本进行数据形式转换时出错,

jslywgbw  于 2个月前  发布在  其他
关注(0)|答案(2)|浏览(43)

请提出你的问题

通过 doccano.py 脚本进行数据形式转换时报错如下:SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xc7 in position 0: invalid continuation byte
请问是什么原因?如何解决谢谢!

piok6c0g

piok6c0g1#

你好,可以检查一下doccano导出的数据是否符合预期,方便的话也可以提供下复现方式。

c2e8gylq

c2e8gylq2#

数据集使用的是飞浆ai studio官网提供的语音报销工单测试数据集,PaddleNLP的版本号为2.4.1,为GPU版。未使用自行标注的数据集。

相关问题