pyspark 在与(连接后删除前导零|)Spark

sd2nnvve  于 2023-02-03  发布在  Spark
关注(0)|答案(1)|浏览(114)

如何在连接后删除前导零,例如,

100|0000000086,
200|000000000087,
100|00000075
300|00007505

我希望这些数据

100|86,
200|87,
100|75,
300|7505

提前感谢你!!

pxyaymoc

pxyaymoc1#

您可以使用regex替换|后面的前导零。在pyspark中,您可以使用regex_replace来获得所需的结果。例如,

df = df.withColumn('new_a', F.regexp_replace(F.col('a'), '\|0*', '|'))

df.show(truncate=False)

输出:

+-----------------------------------------------------------+-------------------------------+
|a                                                          |new_a                          |
+-----------------------------------------------------------+-------------------------------+
|100|0000000086, 200|000000000087, 100|00000075 300|00007505|100|86, 200|87, 100|75 300|7505|
+-----------------------------------------------------------+-------------------------------+

相关问题