我运行的是Hive 071。我有一个表,它有多行,列值相同。
x | y |
---------
1 | 2 |
1 | 3 |
1 | 4 |
2 | 2 |
3 | 2 |
3 | 1 |
字符串
我希望x列是唯一的,并删除具有相同x瓦尔的行;
x | y |
---------
1 | 2 |
2 | 2 |
3 | 2 |
型
或
x | y |
---------
1 | 4 |
2 | 2 |
3 | 1 |
型
两者都是好的。
由于distinct只对Hive中的整行有效,因此我找不到实现它的方法。
2条答案
按热度按时间t0ybt7op1#
你可以使用distinct关键字:
字符串
vzgqcmou2#
尝试以下查询以获得结果:
select A.x,A.y from(select x,y,rank()over(partition by x order by y)as ranked from testingg)A其中ranked=1;