我有来自netezza表的sqoopd数据,输出文件是hdfs格式的,但有一列是时间戳,我想在配置单元表中将它作为日期列加载。我想用这个列在date上创建分区。我该怎么做?
示例:在hdfs中,数据类似于=2013-07-30 11:08:36
在hive中,我只想加载日期(2013-07-30),而不是时间戳。我想每天在那一列上分区。
如何动态地按列传递分区?
我尝试过将数据作为源加载到一个表中。在最后一个表中,我将执行insert overwrite table partition by(date\u column=dynamic date)select*from table1
2条答案
按热度按时间2lpgd9681#
设置这2个属性-
查询可以是-
您可以探索hive导入的两个选项—如果是增量导入,您将能够获得当天的分区。
jgovgodb2#
您可以通过启用动态分区并使用to\ u date函数将时间戳转换为日期,从emp加载emp\ u history表
代码可能如下所示。。。。