我为每个客户提供了两个项目列表,itemlista和itemlistb
Customer_id ItemListA ItemListB
24 2,3 3,4,5
26 6,7 8,9,10
25 4,5 5,8
我希望itemlistb中的项不在itemlista中,因此输出应该是:
Customer_id ItemListB_A
24 4,5
26 8,9,10
25 4,8
我不知道如何从Hive中的两个字符串中减去项目。我知道collect\u set,但它可以删除重复项,但不能删除项目交集。
4条答案
按热度按时间niwlg2el1#
1rhkuytd2#
这将得到预期的结果。
lmvvr0a83#
hrysbysz4#