我想将以下语句转换为df select语句:
Select
YY,
PP,
YYYY,
PPPP,
Min(ID) as MinId,
Max(ID) as MaxID
from LoadTable
我尝试了以下方法,但似乎不起作用:
df.select(df.ID,df.YY, df.PP,df.YYYY,df.PPPPP).agg({"ID": "max", "ID": "min"}).toPandas().to_csv(outputFile, sep="|", header=True, index=False)
1条答案
按热度按时间j0pj023g1#
在执行聚合函数时,这里可能缺少
GROUP BY
声明。如果是这样,您的sql语句将是:相应的pyspark dataframe语句将是
嗯!