pig脚本strsplit

qkf9rpyu  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(416)

我的列的名字和姓氏用空格隔开。我想使用pig函数来拆分成两个不同的列。我想到strsplit函数,但不知道怎么用。有人能帮我解决这个简单的问题吗?

pvcm50d1

pvcm50d11#

您可以尝试下面的示例代码
我现在做的是
1.将每一行读作单列
2.使用空格作为分隔符应用strsplit函数
3.将firstname和lastname存储到两个不同的列中

input.txt
Pearson Charles
James  Michael
Smith Linda

PigScript:
A = LOAD 'input.txt' AS line;
B = FOREACH A GENERATE FLATTEN(STRSPLIT(line,'\\s+',2)) AS (firstname:chararray,lastname:chararray);
C = FOREACH B GENERATE firstname,lastname;
DUMP C;

Output:
(Pearson,Charles)
(James,Michael)
(Smith,Linda)

查看此链接的更多信息
http://pig.apache.org/docs/r0.13.0/func.html#strsplit

相关问题