如果xml数据在文件中可用,下面的链接中提供了很好的解决方案,https://github.com/databricks/spark-xml
下面的代码通过加载物理文件将xml转换为数据集。。
Dataset<Row> df = sqlContext.read().format("com.databricks.spark.xml")
.option("rowTag", "book")
.load("file:///C:/books.xml");
但如果javardd中有xml数据,那么如何转换成数据集呢?
暂无答案!
目前还没有任何答案,快来回答吧!