试验数据:
df = spark.createDataFrame([(1, 1), (2, 3), (3, 3)], ['c1', 'c2'])
df.show()
# +---+---+
# | c1| c2|
# +---+---+
# | 1| 1|
# | 2| 3|
# | 3| 3|
# +---+---+
我打算对每一行中不同的值进行计数,并用count创建一个单独的列。怎么做?
预期结果:
# +---+---+---+
# | c1| c2| c3|
# +---+---+---+
# | 1| 1| 1|
# | 2| 3| 2|
# | 3| 3| 1|
# +---+---+---+
1条答案
按热度按时间moiiocjp1#
检查尺寸
array_distinct
: