如何在连接后删除前导零,例如,
100|0000000086, 200|000000000087, 100|00000075 300|00007505
我希望这些数据
100|86, 200|87, 100|75, 300|7505
提前感谢你!!
pxyaymoc1#
您可以使用regex替换|后面的前导零。在pyspark中,您可以使用regex_replace来获得所需的结果。例如,
|
regex_replace
df = df.withColumn('new_a', F.regexp_replace(F.col('a'), '\|0*', '|')) df.show(truncate=False)
输出:
+-----------------------------------------------------------+-------------------------------+ |a |new_a | +-----------------------------------------------------------+-------------------------------+ |100|0000000086, 200|000000000087, 100|00000075 300|00007505|100|86, 200|87, 100|75 300|7505| +-----------------------------------------------------------+-------------------------------+
1条答案
按热度按时间pxyaymoc1#
您可以使用regex替换
|
后面的前导零。在pyspark中,您可以使用regex_replace
来获得所需的结果。例如,输出: