我创建了一个分区表:
create table t1 ( amount double) partitioned by ( events_partition_key string) stored as paquet;
向tmp\u表中添加了一些数据,其中“events\u partition\u key”列包含以下格式的时间戳(字符串类型):“2018-02-25 00:00:00”
然后我在分区表中插入一些数据。
insert into table t1 partition (events_partition_key)
select amount, events_partition_key
from tmp_table
从新分区表t1中选择时,在某些情况下,事件分区键列定期显示,与tmp表中显示的相同,即“2018-02-25 00:00:00”,但在大多数情况下,它显示为url编码,即“2018-02-25 00%3a00%3a00”
在任何情况下,原始列分区\u键在是否进行url编码的情况下没有区别,
显示新表的分区时:
show partitions t1;
我将所有url编码了两次(即“2018-02-25 00%253a00%253a00”),但在某些情况下仅编码一次(即“2018-02-25 00%3a00%3a00”)
只有在原始值成为分区键之后,它才没有错。
1条答案
按热度按时间vd2z7a6w1#
jira hive-3679将hive.decode.partition.name属性添加到0.10.0版的hiveconf.java中
试着把它变成现实。