我当前正在将数据导入配置单元表。当我们创建我们使用的表时
CREATE EXTERNAL TABLE Customers
(
Code string,
Company string,
FirstName string,
LastName string,
DateOfBirth string,
PhoneNo string,
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n';
因为我们的数据中有逗号。但是,我们现在发现逗号仍然被视为字段分隔符,以及用来分隔字段的|。有办法解决这个问题吗?我们是否必须对数据中的每一个逗号都进行转义,还是有更简单的方法来设置它?
示例数据
1|2|3|4
a|b|c|d
John|Joe|Bob, Jr|Alex
当放在table上的时候
1 2 3 4
a b c d
John Joe Bob Jr
jr占据了自己的专栏,把亚历克斯从table上撞了下来。
1条答案
按热度按时间mwg9r5ms1#
使用你的数据对我来说效果很好。配置单元版本为0.13