将数据插入到带方框的配置单元表中

xoshrz7s 于 2021-05-29 发布在 Hadoop

关注(0)|答案(1)|浏览(398)

关于创建/插入数据到配置单元的带扣表中的建议。
我读了些书(https://cwiki.apache.org/confluence/display/hive/languagemanual+ddl+bucketedtables)尝试了一些选择，但没有成功。
当前运行insert时出现以下错误： Error while processing statement: FAILED: Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask 创建代码： CREATE test_in ( id VARCHAR(250), field_1 VARCHAR(250), field_2 VARCHAR(250), field_3 VARCHAR(250), field_4 VARCHAR(250), field_5 VARCHAR(250) ) PARTITIONED BY(ds STRING) CLUSTERED BY(id) into 10 buckets STORED AS orc tblproperties("orc.compress"="NONE","transactional"="true"); 插入代码： INSERT INTO TABLE test_in VALUES ( '9gD0xQxOYS', 'ZhQbTjUGLhz8KuQ', 'SmszyJHEqIVAeK8gAFVx', 'RvbRdU7ia1AMHhaXd9tOgLEzi', 'a010E000004uJt8QAE', 'yh6phK4ZG7W4JaOdoOhDJXNJgmcoZU' ) 需要帮助为create/insert语句创建正确的语法，并对配置单元中的bucketing进行一些解释。

sql hadoop Hive sql-insert Insert

来源：https://stackoverflow.com/questions/57305048/insert-data-into-bucketed-hive-table

1条答案

按热度按时间

55ooxyrt1#

创建语句-单词 table 不见了(可能是打字错误）
insert语句-缺少分区详细信息。插入操作期间需要分区值，因为它是分区表。
正确和有效的查询如下：，
创建语句：

CREATE TABLE test_in (
id VARCHAR(250), 
field_1 VARCHAR(250), 
field_2 VARCHAR(250), 
field_3 VARCHAR(250),
field_4 VARCHAR(250), 
field_5 VARCHAR(250)
)
PARTITIONED BY(ds STRING)
CLUSTERED BY(id) into 10 buckets
STORED AS orc

插入语句：

INSERT INTO test_in
PARTITION (ds='123')
VALUES (
'9gD0xQxOYS',
'ZhQbTjUGLhz8KuQ',
'SmszyJHEqIVAeK8gAFVx',
'RvbRdU7ia1AMHhaXd9tOgLEzi',
'a010E000004uJt8QAE',
'yh6phK4ZG7W4JaOdoOhDJXNJgmcoZU'
)

希望这有帮助！

赞(0）回复(0）举报 2021-05-29

我来回答

将数据插入到带方框的配置单元表中

1条答案

相关问题

热门标签

最新问答