如何在SQL/Hive中执行此操作?
columnA columnB columnC
100.10 50.60 30
100.10 50.60 30
100.10 50.60 20
100.10 70.80 40
字符串
输出应为:
columnA columnB No_of_distinct_colC
100.10 50.60 2
100.10 70.80 1
型
我认为是正确的问题:
SELECT columnA,columnB,COUNT(distinct column C)
from table_name
group by columnA,columnB
型
3条答案
按热度按时间ztigrdn81#
是的,几乎是正确的。但是你有一个简单的错误。你的列名称是错误的。
字符串
unhi4e5o2#
如果你使用PySpark,下面的代码应该可以工作:
字符串
vsnjm48y3#
字符串