使用pig操作json

5vf7fwbs 于 2021-05-29 发布在 Hadoop

关注(0)|答案(0)|浏览(202)

输入文件（.txt）：-
{“rollno”：“10000232”，“firstname”：“tom”，“lastname”：“peter”，“qualification”：“eng”，“address1”：“block 3”，“address2”：“lane 5”，“city”：“california”，“zipcode”：“10021”}
{“rollno”：“10000223”，“firstname”：“tom”，“lastname”：“john”，“qualification”：“doc”，“address1”：“block 2”，“address2”：“lane 2”，“city”：“california”，“zipcode”：“10021”}
{“rollno”：“10000432”，“firstname”：“tom”，“lastname”：“jim”，“qualification”：“eng”，“address1”：“block 1”，“address2”：“lane 1”，“city”：“california”，“zipcode”：“10021”}
{“rollno”：“10000523”，“firstname”：“tom”，“lastname”：“trek”，“qualification”：“doc”，“address1”：“block 2”，“address2”：“lane 2”，“city”：“california”，“zipcode”：“10021”}
{“rollno”：“10000632”，“firstname”：“tom”，“lastname”：“peter”，“qualification”：“eng”，“address1”：“block 6”，“address2”：“lane 6”，“city”：“california”，“zipcode”：“10021”}
业务规则-
（1）编写两个pig宏follow:- - 连接address1，address2，city-rollno的前6位注意：宏，因为它们将在脚本中重用
（2）打印所有字段：a=使用jsonstorage加载“.txt”
（3）删除address1，address2，city并将其替换为步骤1中的concatenate
（4）删除卷号。并将其替换为step1输出
想法是有一个可配置的方法，因为step1（宏）将在许多脚本中使用。希望在不硬编码字段名的情况下执行此操作。这样做的目的是让代码可以被多个输入文件重用。
非常感谢你的帮助

hadoop JSON bigdata apache-pig macros

来源：https://stackoverflow.com/questions/35207184/manipulating-json-using-pig

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

使用pig操作json

暂无答案！

相关问题

热门标签

最新问答