我需要知道如何在spark中解析xml文件。我正在接收来自Kafka的流数据,然后需要解析这些流数据。
这是我接收数据的spark代码:
directKafkaStream.foreachRDD(rdd ->{
rdd.foreach(s ->{
System.out.println("&&&&&&&&&&&&&&&&&" +s._2 );
});
结果:
<root>
<student>
<name>john</name>
<marks>90</marks>
</student>
</root>
如何传递这些xml元素?
2条答案
按热度按时间nhjlsmyf1#
在处理流数据时,使用databricks的sparkxmllib进行xml数据处理会很有帮助。
参考文献:https://github.com/databricks/spark-xml
6yoyoihd2#
谢谢你们。。问题解决了。这是解决办法。