teradata连接器sqoop sequencefile格式能否克服分隔符问题?

e0bqpujr  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(315)

如果数据库在字段中包含诸如“,”和“\n”之类的字段,是否有一种方法可以将sqoopMap到配置单元而不必修复这些分隔符,可能使用替代格式而不是标准的textfile?已经使用了一些解决方法(例如/替换分隔符、oreplace等)。

nnvyjq4y

nnvyjq4y1#

我找到的解决方案可以在换行符的列基础上解决这个问题:

SELECT 
  COL_A,
  OREPLACE(COL_B, '0A'XC, '_replace_char_'),
  ...,
  COL_N
FROM
  TABLE_NAME

假设这也适用于逗号。我还没有测试是否可以嵌套这个replace char语句。对spool空间使用的影响也没有估计。
答案在第一个问题中,而不是在“答案”中:
https://community.teradata.com/t5/database/removing-a-line-break-character-in-a-column/td-p/52431

相关问题