Sl Now
1 D
2 D
3 D
4 R
5 R
6 C
7 C
8 C
9 D
10 P
11 R
12 R
13 D
我有一个像上面这样的数据集。
Sl Now lead
1 D R
2 D R
3 D R
4 R C
5 R C
6 C D
7 C D
8 C D
9 D P
10 P R
11 R D
12 R D
13 D
我想添加一个名为“lead”的列,它将显示“Now”列的后续值,并与“Now”列中的值的数量相匹配。我们可以用PySpark实现这一点吗?
1条答案
按热度按时间omhiaaxx1#
我会这么做。
准备数据
进口
添加增量ID
获取导联值(方法1)
获取导联值(方法2)