hive:当插入分区表时,在大多数行中,hive double url对分区键列进行编码

nfg76nw0  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(511)

我创建了一个分区表:

create table  t1 ( amount double) partitioned by ( events_partition_key string) stored as paquet;

向tmp\u表中添加了一些数据,其中“events\u partition\u key”列包含以下格式的时间戳(字符串类型):“2018-02-25 00:00:00”
然后我在分区表中插入一些数据。

insert into table t1 partition (events_partition_key)
select amount, events_partition_key
from tmp_table

从新分区表t1中选择时,在某些情况下,事件分区键列定期显示,与tmp表中显示的相同,即“2018-02-25 00:00:00”,但在大多数情况下,它显示为url编码,即“2018-02-25 00%3a00%3a00”

在任何情况下,原始列分区\u键在是否进行url编码的情况下没有区别,
显示新表的分区时:

show partitions t1;

我将所有url编码了两次(即“2018-02-25 00%253a00%253a00”),但在某些情况下仅编码一次(即“2018-02-25 00%3a00%3a00”)

只有在原始值成为分区键之后,它才没有错。

vd2z7a6w

vd2z7a6w1#

jira hive-3679将hive.decode.partition.name属性添加到0.10.0版的hiveconf.java中
试着把它变成现实。

set hive.decode.partition.name=true;

相关问题