use mydb;
CREATE TABLE IF NOT EXISTS my_table(
processed_date date,
source varchar(100) ,
table_name varchar(1000) ,
comments varchar(1000) ,
column varchar(255)
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION 'hdfs://xxxxxx/xxxxxx/my_table ';
我有这样的表定义。我用一个spark程序在这个表中插入一些记录。表在很短的时间内有太多分区。对表的任何查询都非常慢。如何限制/减少创建的分区数。
暂无答案!
目前还没有任何答案,快来回答吧!