我在dataframe(df)中有一个pyspark对象列,如下所示:
| 'A' |
-------------------------
| field 1 - order - one |
| field 2 - sell |
| order |
| sell |
我想在使用regex_replace或其他SQL函数之前删除第一个出现的'- '和所有字符,但在这种情况下会有一点麻烦。下面是所需的输出:
| 'A' |
-------------------
| order - one |
| sell |
| order |
| sell |
2条答案
按热度按时间g9icjywg1#
这应该行得通
输出:
mzaanser2#
另一种解决方法是按字符拆分列A,然后对结果数组进行切片并获取元素。