如何在用“^p”分隔符分隔的数据上构建配置单元表

1yjd4xko  于 2021-06-26  发布在  Hive
关注(0)|答案(2)|浏览(727)

我的问题是:

CREATE EXTERNAL TABLE gateway_staging (
  poll int,
  total int,
  transaction_id int,
  create_time timestamp,
  update_time timestamp
  )
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '^P';

(我不确定“^p”是否可用作分隔符,但已试用)
当我将数据加载到配置单元表中时,结果显示所有字段为“none”。
数据如下所示:
4307421698 ^p200 ^p138193920770 ^p2017-03-08 02:46:18.021204 ^p2017-03-08 02:46:18.021204
请帮帮我。

bakd9h0s

bakd9h0s1#

以下是选项: ... fields terminated by '\020' (八进制) ... fields terminated by '16' (十进制) ... fields terminated by '\u0010' (十六进制)
请注意,有一个与unicode文本('\u0010')相关的错误,该错误在版本2.1中应该已修复,因此使用第3个选项在早期版本中不起作用。https://issues.apache.org/jira/browse/hive-13434

5lhxktic

5lhxktic2#

八进制值 ^P020 . 尝试,

CREATE EXTERNAL TABLE gateway_staging (
  poll int,
  total int,
  transaction_id int,
  create_time timestamp,
  update_time timestamp
  )
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '\020';

相关问题