如何根据pig中列的不同值拆分关系

mitkmikd  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(408)

如果假设我有一个employee关系,它的模式是name,age,location,salary,department..现在我想根据列的不同值拆分这个关系。
就像所有在纽约工作的员工都是一种关系一样,所有在伦敦工作的员工都是一种关系,以此类推。。

hgncfbus

hgncfbus1#

使用split.txt,假设文件是employee.txt,字段以制表符分隔。

A = LOAD 'Employee.txt' USING PigStorage('\t') AS (name:chararray, age:int, location:chararray, salary:double, department:chararray);
SPLIT A INTO X IF location == 'New York', Y IF location == 'London';
DUMP X;
DUMP Y;

相关问题