在配置单元表中保留最新记录

bt1cpqcv  于 2021-06-24  发布在  Hive
关注(0)|答案(0)|浏览(313)

我有一个大约有1亿条记录的表,每天我们得到大约10万条更新的记录。目前我们正在申请 ROW_NUMBER 在时间戳上,通过 UNION ALL .
使用这种方法,我们将面临严重的性能问题。
你能从性能的Angular 提出更好的方法吗?

  1. INSERT OVERWRITE TABLE tgt_tbl
  2. SELECT * FROM
  3. (
  4. SELECT row_number() over (partition by acct_num order by time_stamp)
  5. FROM
  6. (SELECT acct_num , time_stamp FROM tgt_tbl
  7. UNION ALL
  8. SELECT acct_num , time_stamp FROM Incremental table
  9. )t1
  10. ) t2
  11. WHERE rnum = 1

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题