我有一个Hive表如下5列
name orderno productcategory amount description
KJFSFKS 1 1 40 D1
KJFSFKS 2 2 50 D2
KJFSFKS 3 2 67 D3
KJFSFKS 4 2 10 D4
KJFSFKS 5 3 2 D5
KJFSFKS 6 3 5 D6
KJFSFKS 7 3 6 D7
KJFSFKS 8 4 8 D8
KJFSFKS 9 5 8 D9
KJFSFKS 10 5 10 D10
基于相同产品类别代码的所需输出,如果productcategory代码跨多行添加金额字段相同,则根据最高订单号选择描述,订单号始终选择最低,输出如下
name orderno productcategory amount description
KJFSFKS 1 1 40 D1
KJFSFKS 2 2 127 D4
KJFSFKS 5 3 13 D7
KJFSFKS 8 4 8 D8
KJFSFKS 9 5 18 D10
如上所述,有些字段的顺序不同,有些字段的顺序不同
我用了groupby,但是sum(amount)很好,那么description字段呢,它是基于orderno列的,在我的需求中还有其他列,我应该根据订单号来选择
2条答案
按热度按时间w41d8nur1#
7xzttuei2#