我有一个 Dataframe :
id vehicle asIs EU EU_variant
1 A3345 PQ1298 FV1 FV1_variant
2 A3346 PQ1287 FV2 FV2_variant
3 A3346 PQ1207 FV2 FV2_variant
4 A3347 QP9 QP9_variant
5 A3347 QP9 QP9_variant
6 A3347 QP3 QP3_variant
7 A3348 MP6553 YR34 YR34_variant
8 A3348 MP6554 YR35 YR35_variant
9 A3348 MP6554 YR35 YR35_variant
对于不同车辆和不同的EU,我想对EU_variant进行排序,并在新列中将其连接起来
结果应该是:
id vehicle asIs EU EU_variant ECU_Variant_rank
1 A3345 PQ1298 FV1 FV1_variant FV1_variant(1)
2 A3346 PQ1287 FV2 FV2_variant FV2_variant(1)
3 A3346 PQ1207 FV2 FV2_variant FV2_variant(2)
4 A3347 QP9 QP9_variant QP9_variant(1)
5 A3347 QP9 QP9_variant QP9_variant(2)
6 A3347 QP3 QP3_variant QP3_variant(1)
7 A3348 MP6553 YR34 YR34_variant YR34_variant(1)
8 A3348 MP6554 YR35 YR35_variant YR35_variant(1)
9 A3348 MP6554 YR35 YR35_variant YR35_variant(2)
如何使用pyspark dataframe实现此操作
1条答案
按热度按时间r8xiu3jd1#
您可以将
Window
与rank搭配使用:结果如下: