我有一个pyspark df如下:如何使用fill na来填充7天滚动窗口中的平均值,但与类别值相对应,例如,桌面到桌面、移动到移动等。。
dm7nw8vv1#
你可以 coalesce 7天滚动平均值:
coalesce
from pyspark.sql import functions as F, Window df2 = df.withColumn( 'sessoes', F.coalesce( F.col('sessoes'), F.avg('sessoes').over(Window.partitionBy('device').orderBy('data').rowsBetween(-7,0)) ) )
1条答案
按热度按时间dm7nw8vv1#
你可以
coalesce
7天滚动平均值: