选择具有条件的组的第一行

mnemlml8 于 2021-06-26 发布在 Hive

关注(0)|答案(1)|浏览(369)

我有一个这样的表格：

FieldA   FieldB   FieldC
1111     ABC      X
1111     DEF      Y
1111     GHI      X
2222     JKL      Y
2222     MNO      X
3333     PQR      U
3333     STT      U

我想为每个fielda选择一个fieldb，优先选择fieldc中的x（如果没有x，则选择另一个）。
我试过使用带有分区的秩函数，但是我发现它太不一致了，我现在遇到了一堵墙。
我的输出如下所示：

FieldA   FieldB   FieldC
    1111     ABC      X
    2222     MNO      X
    3333     PQR      U

查询：

Select
rank() over (partition by Field3 order by Field1),
Field,1 Field2, Field3
FROM table
ORDER BY Field1, Field3

我想我需要把这个查询放在一个子查询中。。。

sql Hive impala

来源：https://stackoverflow.com/questions/43371057/select-first-row-of-group-with-criteria

1条答案

按热度按时间

u0njafvf1#

你可以用 ROW_NUMBER 这样地：

SELECT FieldA, FieldB, FieldC
FROM (
   SELECT FieldA, FieldB, FieldC,
          ROW_NUMBER() OVER (PARTITION BY FieldA
                             ORDER BY CASE 
                                         WHEN FieldC = 'X' THEN 1
                                         ELSE 2
                                      END,
                                      FieldB) AS rn 
   FROM mytable) AS t
WHERE t.rn = 1

上面的查询从每个记录中选取一个记录 FieldA 分区。它优先考虑 FieldC = 'X' 所有其他记录。

赞(0）回复(0）举报 2021-06-26

我来回答

选择具有条件的组的第一行

1条答案

相关问题

热门标签

最新问答