<CATALOG>
<BOOK>
<TITLE>Hadoop Defnitive Guide</TITLE>
<AUTHOR>Tom White</AUTHOR>
<COUNTRY>US</COUNTRY>
<COMPANY>CLOUDERA</COMPANY>
<PRICE>24.90</PRICE>
<YEAR>2012</YEAR>
</BOOK>
</CATALOG>
这是我正在使用的xml。
我只想提取title和company元素。有没有任何方法可以使用regex或xpath()提取它们;
1条答案
按热度按时间iovurdzv1#
首先需要对xml进行如下格式化:
然后你可以像这样提取这些元素:
有关轴的更多信息,请参见:http://www.w3schools.com/xsl/xpath_axes.asp