用emp1 plus中的数据集覆盖目标表( union all )emp2表中的旧数据。注意 distribute by 在查询的最后-这是为了优化分区创建,最终的缩减器将只接收它们的分区数据,这将减少内存消耗。
insert overwrite table emp2 partition(occupation)
select userid, name, country, occupation from emp1
union all
select userid, name, country, occupation from emp2
distribute by occupation;
1条答案
按热度按时间l7mqbcuq1#
用emp1 plus中的数据集覆盖目标表(
union all
)emp2表中的旧数据。注意distribute by
在查询的最后-这是为了优化分区创建,最终的缩减器将只接收它们的分区数据,这将减少内存消耗。此外,您还可以使用行\ u number()添加或删除重复项。