计算球队比赛的总数,当它出现在HomeTeam和AwayTeam列使用Pandas/pyspark.我想到了使用join。首先,我groupby()了HomeTeam,得到了HomeTeam和AwayTeam的比赛次数结果。然后根据球队名称加入他们。我附上了 Dataframe :x1c 0d1x是否有更好的方法来实现这一点
HomeTeam
AwayTeam
groupby()
carvr3hs1#
您可以对两个团队都执行 groupby(这符合您的要求:* “当它同时出现在主队和客场队时”*):
df.groupBy("HomeTeam","AwayTeam").count().show(truncate=False)
1条答案
按热度按时间carvr3hs1#
您可以对两个团队都执行 groupby(这符合您的要求:* “当它同时出现在主队和客场队时”*):