我有一个sqoop作业,它将数据直接从oracle数据库加载到microsoftazurehdinsights hadoop集群上的配置单元架构。不过,在导入基于char的字段(比如varchar变量)时,我发现这些字段是作为字符串导入的。这没什么错,对我来说很好。但是,有一点不方便,那就是配置单元数据库中的字符串字段占用了该字段的最大长度。这意味着每次在该字段上执行条件时都要使用微调功能。是否有任何sqoop参数或解决方法允许我不使用trim?致以最诚挚的问候
92vpleto1#
您还可以使用varchar数据类型导入数据,以避免将其转换为字符串。你可以用 --map-column-hive 为实现这一点而争论。此参数将覆盖配置列从sql类型到配置单元类型的默认Map。用法:
--map-column-hive
sqoop import <generic args> --map-column-hive column_name=varchar(200)
1条答案
按热度按时间92vpleto1#
您还可以使用varchar数据类型导入数据,以避免将其转换为字符串。你可以用
--map-column-hive
为实现这一点而争论。此参数将覆盖配置列从sql类型到配置单元类型的默认Map。用法: