CREATE TABLE IF NOT EXISTS employee_partition_bucket
(
employeeID Int,
firstName String,
designation String,
salary Int
)
PARTITIONED BY (department string)
CLUSTERED BY (designation) INTO 2 BUCKETS
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n';
3条答案
按热度按时间93ze6v8z1#
你可以!!在这种情况下,您将在分区数据中拥有存储桶!
vsmadaxz2#
对。
分区就是将数据划分到hdfs上的多个目录中。每个目录都是一个分区。例如,如果表定义如下
然后在hdfs上会有如下目录
bucketing是关于如何在分区中分布数据的,因此在hdfs上会有类似的文件
参考文献:https://cwiki.apache.org/confluence/display/hive/languagemanual+ddl+bucketedtableshttp://www.hadooptpoint.com/hive-buckets-optimization-techniques/
inn6fuwd3#
是的,这是直截了当的。
请尝试以下操作:
在本例中,我创建了按部门划分的分区和按名称划分的桶
希望这对你有帮助