计算球队的比赛总数,当它出现在主队和客场队col使用Pandas/pyspark

kcrjzv8t  于 2023-02-02  发布在  Spark
关注(0)|答案(1)|浏览(130)

计算球队比赛的总数,当它出现在HomeTeamAwayTeam列使用Pandas/pyspark.
我想到了使用join。首先,我groupby()了HomeTeam,得到了HomeTeamAwayTeam的比赛次数结果。然后根据球队名称加入他们。我附上了 Dataframe :x1c 0d1x是否有更好的方法来实现这一点

carvr3hs

carvr3hs1#

您可以对两个团队都执行 groupby(这符合您的要求:* “当它同时出现在主队和客场队时”*):

df.groupBy("HomeTeam","AwayTeam").count().show(truncate=False)

相关问题