我在用Hive。假设我有一个要选择的列日志(userid、time、descripe) userID
, min(time)
,按userid从日志组进行描述。有什么办法我可以用Hive一步完成吗?当我想到 mapreduce <key, value>
算法方面,但我有这么多的文件,还有一个步骤,所以导致我的问题。
例子:
(userID, time, describe) = {(1, 2, 2), (2, 3, 3), (1, 1, 1), (1, 3, 3), (2, 1, 1)}
我期望的是:
(userID, time, describe) = {(1, 1, 1), (2, 1, 1)}
1条答案
按热度按时间46scxncf1#
可以通过调整cte和窗口函数的秩来实现。
ie公司