pyspark XML字符串转换为XML字符串时,不断转换不需要的字符

idfiyjo8  于 2024-01-06  发布在  Spark
关注(0)|答案(1)|浏览(187)

我试图在一个列中创建一个XML,但作为一个标准的XML,我总是得到不正确的输出,因为现在我总是在XML之前得到“b”,XML以"

请参见下面的示例

  1. b'<Item><ItemInformation><DescriptionModule><Information><Name>DropShots</Name></Information></DescriptionModule></ItemInformation></Item>'

字符串

我的验证码:

  1. XMLstring = ET.tostring((E.Item(E.ItemInformation(E.DescriptionModule(E.Information(E.Name(Value)))))))
  2. df = spark.createDataFrame([("123", str(XMLstring))],["Rule_Id", "XML"])
  3. display(df)

我期待:

  1. Rule_Id XML
  2. 123
  3. <Item><ItemInformation><DescriptionModule><Information><Name>DropShots</Name></Information></DescriptionModule></ItemInformation></Item>

但我得到了:

  1. Rule_Id XML
  2. 123
  3. b'<Item><ItemInformation><DescriptionModule><Information><Name>DropShots</Name></Information></DescriptionModule></ItemInformation></Item>'`

kuarbcqp

kuarbcqp1#

尝试将.decode()添加到.tostring()的末尾.

  1. XMLstring = ET.tostring((E.Item(E.ItemInformation(E.DescriptionModule(E.Information(E.Name(Value))))))).decode()

字符串

相关问题