Python错误“格式不正确(标记无效)”

jxct1oxe  于 2023-01-12  发布在  Python
关注(0)|答案(2)|浏览(140)

我有一些软件可以输出一个XML文件,我正试图用Python读取这个文件,这样我就可以得到结果并将其添加到我的数据库中。

import xml.etree.ElementTree as etree
with open('E:/uk_bets_history.xml', 'r') as xml_file:
    xml_tree = etree.parse(xml_file)

我收到错误“xml.etree.元素树.解析错误:格式不正确(标记无效):第1行,第1列”,但不确定为什么它的格式不正确。我不能控制文件是如何创建的,因为这是由我拥有的其他一些软件完成的。
示例xml如下所示:http://jarrattperkins.com/uk_bets_history

aor9mmx1

aor9mmx11#

您作为示例提供的文件使用UTF-8和BOM编码,因此您需要使用带有encoding参数的open()

open("FILE_PATH", encoding="utf-8-sig")
eh57zj3b

eh57zj3b2#

with open(file=file_path, mode='r', encoding='utf-8-sig') as xml_txt:                 
  root = ET.fromstring((xml_txt.read().encode('utf-8')), ET.XMLParser(encoding='utf-8'))

这对我很有效。谢谢Jules_96

相关问题