我有一个ParquetHive表,其中有日期和小时作为分区列。我的spark作业每隔3小时运行一次。每次运行时,它都会创建动态分区。任务完成得很快,但是创建分区需要很多时间。有什么办法可以加快这一进程吗?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!