HDFS 使用HiveQL修改外部表的分隔符

7xzttuei  于 2022-12-09  发布在  HDFS
关注(0)|答案(1)|浏览(220)

我正在从HDFS中获取一个CSV文件,并将其传输到我在hive中的外部表。
但我的CSV文件有分隔符“;“在我的第二个专栏中,我有“;“沿着信息。
您可以在下图中看到:

你能指导我该怎么做吗?有没有任何Hive属性允许我这样做或者其他解决方案?

jyztefdp

jyztefdp1#

默认情况下,ROW FORMAT TEXT FIELDS TERMINATED BY ';'会将其拆分
如果希望(OS)值成为第二列的一部分,则需要将该列用引号引起来。例如A;"Mozilla//5.0;(Linux)";BR。换句话说,更改文件在配置单元 * 之外的写入/存储方式 *
如果无法修改该文件,则可以使查询只连接这两列,例如SELECT CONCAT(user_agent, ';', os) FROM data;

相关问题