通过 doccano.py 脚本进行数据形式转换时报错如下:SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xc7 in position 0: invalid continuation byte请问是什么原因?如何解决谢谢!
piok6c0g1#
你好,可以检查一下doccano导出的数据是否符合预期,方便的话也可以提供下复现方式。
c2e8gylq2#
数据集使用的是飞浆ai studio官网提供的语音报销工单测试数据集,PaddleNLP的版本号为2.4.1,为GPU版。未使用自行标注的数据集。
2条答案
按热度按时间piok6c0g1#
你好,可以检查一下doccano导出的数据是否符合预期,方便的话也可以提供下复现方式。
c2e8gylq2#
数据集使用的是飞浆ai studio官网提供的语音报销工单测试数据集,PaddleNLP的版本号为2.4.1,为GPU版。未使用自行标注的数据集。