使用tez引擎和ambari日志将数据加载到hive显示已完成,但日志挂起,而没有完成对这些分区的插入

o8x7eapl  于 2021-06-25  发布在  Hive
关注(0)|答案(1)|浏览(373)

我们正在使用tez执行引擎将数据加载到配置单元表中。我们用来加载的作业处于运行状态,但是在应用程序id的ambari上,我们看到它成功了,从日志中我们可以看到它被卡住了。它有大约90个分区,而且卷也非常相似。作业每天运行,并加载大约3个月的数据。
卡住的日志示例:

Partition aa.db.tablename{dt=2020-02-06} stats: [numFiles=42, numRows=265732, totalSize=9005011, rawDataSize=34024246] 
Partition aa.db.tablename{dt=2020-02-07} stats: [numFiles=42, numRows=265853, totalSize=9310285, rawDataSize=34399056]

成功日志示例:

Partition aa.db.tablename{dt=2020-02-06} stats: [numFiles=42, numRows=265732, totalSize=9005011, rawDataSize=34024246] 
Partition aa.db.tablename{dt=2020-02-07} stats: [numFiles=42, numRows=265853, totalSize=9310285, rawDataSize=34399056] 

OK 
Time taken: 1385.571 seconds
t1rydlwq

t1rydlwq1#

将此属性设置为false有助于我们加载数据 set hive.stats.autogather=false; 由于我们有400多个分区,我们还禁用了 set hive.stats.fetch.partition.stats=false; 但这更多的是止血和临时补片。

相关问题