我有一个avro格式的表在Hive。该表中的一列(字符串数据类型)包含具有新行字符的数据,因此当我选择(使用beeline或pyspark)时,会得到多行。我在select中尝试了regexp\u replace(col1,“\n”,”“)选项,但它仍然返回多行。
col1的值在文本编辑器中复制和粘贴时如下所示:
NY - Enjoy holidays or Enjoy leaves.
Silver 2000 plan
Silver 2000 plan CSR 1
Silver 2000 plan CSR 2
Gold 600 plan
Enjoy, holidays then leaves for ER, UC and old age only. Primary holidays not subject to Enjoy.
在这里有什么可以替代的呢?
2条答案
按热度按时间s8vozzvw1#
试试这个
regexp_replace(col1, '\\\\n', "")
例子ojsjcaue2#
它用regexp\u replace(regexp\u replace(col1,'\r',''),'\n',''解析