jieba 词语是Unicode对词语做文本分析存在的问题

jdgnovmf  于 4个月前  发布在  其他
关注(0)|答案(1)|浏览(86)

用结巴对文本分完词之后,由于词语是以Unicode形式存在,每当我要将其导出为txt或CSV文件,就会存在编码的问题。我想了一个本办法,把打印出来的结果直接复制粘贴,可是对于有几万行的输出,有什么别的办法吗?

iklwldmw

iklwldmw1#

编一下码不就好了么?比如:data.encode("utf-8")

相关问题