如何在pig脚本的foreach循环中运行store并在hdfs中的特定路径中存储

b91juud3  于 2021-06-21  发布在  Pig
关注(0)|答案(0)|浏览(272)

我需要按组存储数据。使用后 grouped = group events by (name,type); 当我描述以下内容时,我就明白了:

{group: (name: chararray,type: chararray),events: {(eventDate: chararray, name: chararray,type: chararray)}}

每组和元组的eg:

{(“group1name,group1type”),(1,b,c),(2,f,e),(1,4,3)}
{(“group2name,group2type”),(2,d,e)}
{(“group3name,group3type”),(3,r,e),(4,s,e)}
所以我想将(1,b,c),(2,f,e),(1,4,3)存储在路径“group1.name/group1.type/datafile”中,(2,d,e)存储在路径“group2.name/group2.type/datafile”中,依此类推。我该怎么做?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题