我有以下资料:-
结果状态包括名称WINXYZCLUB1WINXYZCLUB2WINXYZCLUB1WINPQRCLUB3
我需要州明智的最大赢家俱乐部名称
val byState =Window.partitionBy("state").orderBy('state)
我试图创建一个窗口,但没有帮助。。
预期结果:-
有些在sql中是这样的
select temp.res
(select count(result) as res
from table
group by clubName) temp
group by state
例如
winsclubnamexyz2club1的状态最大\u计数\u
2条答案
按热度按时间baubqpgj1#
您可以获得每个俱乐部的赢数,然后为按赢数排序的每个俱乐部分配排名,并筛选排名为1的行。
hsgswve42#
您还可以将sql方言与sparksql结合使用(在此处查找文档):
其中dataframe中的表将被命名为
Table1
以及你的Dataframedf
.p、 如果你想自己尝试,使用初始化
在http://sqlfiddle.com.