使用pig操作json

5vf7fwbs  于 2021-05-29  发布在  Hadoop
关注(0)|答案(0)|浏览(184)

输入文件(.txt):-
{“rollno”:“10000232”,“firstname”:“tom”,“lastname”:“peter”,“qualification”:“eng”,“address1”:“block 3”,“address2”:“lane 5”,“city”:“california”,“zipcode”:“10021”}
{“rollno”:“10000223”,“firstname”:“tom”,“lastname”:“john”,“qualification”:“doc”,“address1”:“block 2”,“address2”:“lane 2”,“city”:“california”,“zipcode”:“10021”}
{“rollno”:“10000432”,“firstname”:“tom”,“lastname”:“jim”,“qualification”:“eng”,“address1”:“block 1”,“address2”:“lane 1”,“city”:“california”,“zipcode”:“10021”}
{“rollno”:“10000523”,“firstname”:“tom”,“lastname”:“trek”,“qualification”:“doc”,“address1”:“block 2”,“address2”:“lane 2”,“city”:“california”,“zipcode”:“10021”}
{“rollno”:“10000632”,“firstname”:“tom”,“lastname”:“peter”,“qualification”:“eng”,“address1”:“block 6”,“address2”:“lane 6”,“city”:“california”,“zipcode”:“10021”}
业务规则-
(1) 编写两个pig宏follow:- - 连接address1,address2,city-rollno的前6位注意:宏,因为它们将在脚本中重用
(2) 打印所有字段:a=使用jsonstorage加载“.txt”
(3) 删除address1,address2,city并将其替换为步骤1中的concatenate
(4) 删除卷号。并将其替换为step1输出
想法是有一个可配置的方法,因为step1(宏)将在许多脚本中使用。希望在不硬编码字段名的情况下执行此操作。这样做的目的是让代码可以被多个输入文件重用。
非常感谢你的帮助

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题