我正在从HDFS中获取一个CSV文件,并将其传输到我在hive中的外部表。但我的CSV文件有分隔符“;“在我的第二个专栏中,我有“;“沿着信息。您可以在下图中看到:
你能指导我该怎么做吗?有没有任何Hive属性允许我这样做或者其他解决方案?
jyztefdp1#
默认情况下,ROW FORMAT TEXT FIELDS TERMINATED BY ';'会将其拆分如果希望(OS)值成为第二列的一部分,则需要将该列用引号引起来。例如A;"Mozilla//5.0;(Linux)";BR。换句话说,更改文件在配置单元 * 之外的写入/存储方式 *如果无法修改该文件,则可以使查询只连接这两列,例如SELECT CONCAT(user_agent, ';', os) FROM data;
ROW FORMAT TEXT FIELDS TERMINATED BY ';'
(OS)
A;"Mozilla//5.0;(Linux)";BR
SELECT CONCAT(user_agent, ';', os) FROM data;
1条答案
按热度按时间jyztefdp1#
默认情况下,
ROW FORMAT TEXT FIELDS TERMINATED BY ';'
会将其拆分如果希望
(OS)
值成为第二列的一部分,则需要将该列用引号引起来。例如A;"Mozilla//5.0;(Linux)";BR
。换句话说,更改文件在配置单元 * 之外的写入/存储方式 *如果无法修改该文件,则可以使查询只连接这两列,例如
SELECT CONCAT(user_agent, ';', os) FROM data;