我有一个 Dataframe ,其中包含一列字符串:
| 色谱柱A|
| - ------|
| 编号AB-001 - 1 - 12345-A|
| 编号AB-001 - 1 - 12346-B|
| ABC012345B|
| ABC012346B|
在PySpark中,我想创建一个新列,如果前面有"AB-",新列将删除字符"AB-"并保留其余字符,否则字符串将保持不变。
预期输出:
| 色谱柱A|B栏|
| - ------|- ------|
| 编号AB-001 - 1 - 12345-A|电话001 - 1 - 12345-A|
| 编号AB-001 - 1 - 12346-B|电话001 - 1 - 12346-B|
| ABC012345B|ABC012345B|
| ABC012346B|ABC012346B|
1条答案
按热度按时间jogvjijk1#
希望这对你有用
产出
请接受这个答案,如果这些对你来说很好的话。这样其他人就可以使用这个。