ApacheSpark—在hive中创建动态分区花费了太多时间

r7s23pms  于 2021-06-25  发布在  Hive
关注(0)|答案(0)|浏览(203)

我有一个ParquetHive表,其中有日期和小时作为分区列。我的spark作业每隔3小时运行一次。每次运行时,它都会创建动态分区。任务完成得很快,但是创建分区需要很多时间。有什么办法可以加快这一进程吗?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题