当我在Python 3中使用open and read语法打开和读取文件并更改文件编码时,发生了这个错误。我想将任何编码的文本转换为UTF-8并保存它。
“SIN 3”具有未知的编码,
fh= open(sin3, mode="r", encoding='utf8')
ss= fh.read()
File“/usr/lib/python3.2/codecs.py“,line 300,in decode
(result,consumed)= self._buffer_decode(data,self.errors,final)
UnicodeDecodeError:'utf-8'编解码器无法解码位置34中的字节0xc 7:无效连续字节
我使用了codecs,得到了这个错误:
fh= codecs.open(sin3, mode="r", encoding='utf8')
ss= fh.read()
File“/usr/lib/python3.2/codecs.py“,line 679,in read
return self.reader.read(size)
File“/usr/lib/python3.2/codecs.py“,line 482,in read
newchars,decodedbytes = self.decode(data,self.errors)
UnicodeDecodeError:'utf-8'编解码器无法解码位置34中的字节0xc 7:无效连续字节
3条答案
按热度按时间envsm3lx1#
试试这个:
然后,您可以像往常一样读取文件:
我建议使用Pandas。
在Pandas中,您可以使用以下命令读取它:
daupos2t2#
试试这个:
wvt8vs2t3#
你可以通过使用Pandas库来解决这个问题