我的数据如下:
{(2000),(1800),(2700)}{(2014),(1500),(1900)}等。我创建了一个java自定义项:
DataBag bag = (DataBag)input.get(0);
Tuple categoryCode = null;
Tuple auxiliary = TupleFactory.getInstance().newTuple(3);
int i = 0;
for(Iterator<Tuple> code=bag.iterator(); code.hasNext();) {
categoryCode=code.next();
auxiliary.set(i, categoryCode.get(0).toString());
i+=1;
}
return auxiliary.toDelimitedString(",");
我希望我的输出在不同的列中如下所示:
2000 1800 2700 2014 1500 1900等我的自定义项给我的输出如下:
200018002700 201415001900等在一个单独的栏中请帮助是否有其他解决方案。请帮忙输入。
1条答案
按热度按时间6uxekuva1#
可以按原样返回元组,并在pig脚本中执行展平。