配置单元表分区太多

cclgggtu  于 2021-06-26  发布在  Hive
关注(0)|答案(0)|浏览(229)
use mydb;
CREATE TABLE IF NOT EXISTS my_table(
processed_date date,
source varchar(100) ,
table_name varchar(1000) ,
comments varchar(1000) ,
column varchar(255) 
)     
ROW FORMAT SERDE   'org.apache.hadoop.hive.ql.io.orc.OrcSerde' 
STORED AS INPUTFORMAT   'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' 
OUTPUTFORMAT   'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION  'hdfs://xxxxxx/xxxxxx/my_table ';

我有这样的表定义。我用一个spark程序在这个表中插入一些记录。表在很短的时间内有太多分区。对表的任何查询都非常慢。如何限制/减少创建的分区数。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题