我有以下按年份分组的数据关系。
数据输出为:
YEARDATA: {timestamp: chararray,year: chararray,month: chararray,day: chararray,hour: chararray,minutes: chararray,seconds: chararray}
我想把这些数据存储在基于年/月/日的分区上。
如何使用pig编写以下逻辑?
FOREACH YEARDATA {
--- GENERATE HDFS URL using UDF generateUrl(year, month, day)
---- STORE YEARDATA INTO url USING PigStore(,);
};
请建议。
暂无答案!
目前还没有任何答案,快来回答吧!