我开始学习pig,我想在字符''中拆分一个元组。我原来的元组是
(192.168.2.227\al0000)
我要把它分成
(192.168.2.227, al0000)
我试着用
B = FOREACH original GENERATE FLATTEN (STRSPLIT(tuple, '\\u034B'));
但它不起作用。什么是正确的解决方案?
tf7tbtn21#
你试过了吗 '\\\\' 取代了奇怪的unicode代码点u034b?
'\\\\'
v2g6jxz62#
输入:
192.168.2.227\al0000
Pig脚本:
A = LOAD 'input.csv' as line; B = FOREACH A GENERATE FLATTEN (STRSPLIT(line, '([\\\\])')); dump B;
使用的第二个参数是用于标识“\”的正则表达式输出:
(192.168.2.227,al0000)
裁判:http://pig.apache.org/docs/r0.14.0/func.html#strsplit不能用regex跳过反斜杠吗?
2条答案
按热度按时间tf7tbtn21#
你试过了吗
'\\\\'
取代了奇怪的unicode代码点u034b?v2g6jxz62#
输入:
Pig脚本:
使用的第二个参数是用于标识“\”的正则表达式
输出:
裁判:
http://pig.apache.org/docs/r0.14.0/func.html#strsplit
不能用regex跳过反斜杠吗?