如何在pig中拆分字符“\”中的元组

xesrikrc  于 2021-06-24  发布在  Pig
关注(0)|答案(2)|浏览(350)

我开始学习pig,我想在字符''中拆分一个元组。我原来的元组是

(192.168.2.227\al0000)

我要把它分成

(192.168.2.227, al0000)

我试着用

B =  FOREACH original GENERATE FLATTEN (STRSPLIT(tuple, '\\u034B'));

但它不起作用。什么是正确的解决方案?

tf7tbtn2

tf7tbtn21#

你试过了吗 '\\\\' 取代了奇怪的unicode代码点u034b?

v2g6jxz6

v2g6jxz62#

输入:

192.168.2.227\al0000

Pig脚本:

A = LOAD 'input.csv' as line;  
B = FOREACH A GENERATE FLATTEN (STRSPLIT(line, '([\\\\])'));
dump B;

使用的第二个参数是用于标识“\”的正则表达式
输出:

(192.168.2.227,al0000)

裁判:
http://pig.apache.org/docs/r0.14.0/func.html#strsplit
不能用regex跳过反斜杠吗?

相关问题