我有一个很大的hive表,上面有将近百万条按日期划分的记录。我想根据添加到配置单元表的最后一个分区查找最新日期。有可能在几天或几周内没有记录。所以我不能使用当前日期或当前日期-1来查找最后一个日期。我也尝试了max(摄取日期),但它花了将近140分钟找到日期。
下面是一个示例分区:
ingest_date=2019-6-10
ingest_date=2019-6-7
ingest_date=2019-6-6
ingest_date=2019-6-5
ingest_date=2019-6-4
有没有更好的方法从分区中查找配置单元表中的最新日期而不使用max()函数?
暂无答案!
目前还没有任何答案,快来回答吧!