作为一个研究项目,我决定通过建立一个完整的cdh5环境来使用cloudera impala。然后我决定玩查询数据的游戏。由于某些原因,在impalasql中使用的groupby语句不能使用简单的orderby。 Impala 是否支持此功能?
以下是我的查询在没有排序的情况下的样子:
SELECT TO_DATE(time) AS dt
FROM wearable_data
GROUP BY dt
结果:
0 2014-01-01
1 2014-07-15
2 2014-07-20
3 2014-07-17
现在以下查询不起作用:
SELECT TO_DATE(time) AS dt
FROM wearable_data
GROUP BY dt
ORDER BY dt
-- ORDER BY 1
结果:
Query 6e4da94e0c586e34:7077273d6337e893 100% Complete (23 out of 23)
说明以下内容:
Estimated Per-Host Requirements: Memory=256.00MB VCores=2
WARNING: The following tables are missing relevant table and/or column statistics.
default.wearable_data
04:EXCHANGE [PARTITION=UNPARTITIONED]
|
03:AGGREGATE [MERGE FINALIZE]
| group by: to_date(time)
|
02:EXCHANGE [PARTITION=HASH(to_date(time))]
|
01:AGGREGATE
| group by: to_date(time)
|
00:SCAN HDFS [default.wearable_data]
partitions=1/1 size=1.44KB
有什么想法吗?
1条答案
按热度按时间7d7tgy0s1#
我认为这是你的问题:
“在impala 1.4.0之前,impala要求使用order by子句的查询也包括limit子句”reference here