<?xml version="2.0" encoding="UTF-8" ?><timestamp="20220113">
<defintions>
<defintion id="1" old_id="0">Lang</defintion>
<defintion id="7" old_id="1">Eng</defintion>
如何解析这样的XML文件?在这里,我在一个标签中有多个值。我想提取list
或dataframe
的值,如“ID”和“OLD_ID”。
<?xml version="2.0" encoding="UTF-8" ?><timestamp="20220113">
<defintions>
<defintion id="1" old_id="0">Lang</defintion>
<defintion id="7" old_id="1">Eng</defintion>
如何解析这样的XML文件?在这里,我在一个标签中有多个值。我想提取list
或dataframe
的值,如“ID”和“OLD_ID”。
3条答案
按热度按时间68de4m5k1#
您可以使用
BeautifulSoup
和xml
解析器来实现您的目标,只需选择所需的元素并通过.get()
迭代ResultSet
以提取属性值。示例
输出
| | 身份证|旧标识|
| - ------|- ------|- ------|
| 无|1个|无|
| 1个|七|1个|
vc9ivgsu2#
使用pythonBeautifulSoup,可以将.xml文件解析为BeatufulSoup对象,然后使用.findAll('definitions '),然后循环遍历找到的标记并获得所需的值
参考:https://www.crummy.com/software/BeautifulSoup/bs4/doc/https://linuxhint.com/parse_xml_python_beautifulsoup/
yebdmbv43#
如果您有有效的XMLlike(时间戳标记不能有类似属性的值):
那么您可以使用
pandas
:输出: