我有下表:
df = spark.createDataFrame(
[('a', 1, 11, 44),
('b', 2, 21, 33),
('a', 2, 10, 40),
('c', 5, 55, 45),
('b', 4, 22, 35),
('a', 3, 9, 45)],
['id', 'left', 'right', 'centre'])
我需要查找并仅显示最大值,如下所示:
[![在此处输入图像说明][2]][2]
[[2][3][4][5][6][7][8][9][10][11][12][13][14][15]
1条答案
按热度按时间6pp0gazn1#
简单的
groupBy
和agg
:或者稍微高级一点: