set hive.merge.tezfiles=true;
set hive.merge.smallfiles.avgsize=128000;
set hive.merge.size.per.task=128000;
set mapreduce.input.fileinputformat.split.minsize=100;
set mapreduce.input.fileinputformat.split.maxsize=128000;
set hive.exec.orc.default.block.size=128000;
2条答案
按热度按时间2w3kk1z51#
请尝试以下设置,这些设置有助于保存小文件:
bfhwhh0e2#
您可以尝试设置orc块大小
hive.exec.orc.default.block.size
. 同样要跳过合并小文件,您需要禁用标志。set hive.merge.tezfiles=false;
有关如何生成文件的详细信息,请参阅hortonworks社区线程链接。