避免重复的客户数据

x6h2sr28  于 2021-06-24  发布在  Hive
关注(0)|答案(1)|浏览(258)

我有一个表,它生成一行数据,其中包含两个被认为是同一个人的客户详细信息。此客户是通过sourcekey认识的。该表将有一些场景,其中sourcekey 1与sourcekey 2匹配,并且在下一行中,它将sourcekey 2与sourcekey 1匹配。
我试着用下面的方法剔除我所说的“a-b,b-a匹配”。这是重复的,因为不管哪个是第一个,它是相同的组合。我试过了;

...WHERE SCORES.SOURCEKEY_TO != SCORES.SOURCEKEY_FROM
     AND scores.SOURCEKEY_FROM < scores.SOURCEKEY_TO

但我还是会遇到重复的。

oxcyiej7

oxcyiej71#

请尝试以下操作:

select
distinct
case when SOURCEKEY_TO<SOURCEKEY_FROM then SOURCEKEY_TO else SOURCEKEY_FROM end as SOURCEKEY_FROM, 
case when SOURCEKEY_FROM>SOURCEKEY_TO then SOURCEKEY_FROM else SOURCEKEY_TO end as SOURCEKEY_TO
from scores
where
SOURCEKEY_FROM <> SOURCEKEY_TO

举个例子。

相关问题