将具有多个包的元组拆分为多个元组

yuvru6vn  于 2021-06-25  发布在  Pig
关注(0)|答案(1)|浏览(450)

我的数据如下:
{(2000),(1800),(2700)}{(2014),(1500),(1900)}等。我创建了一个java自定义项:

  1. DataBag bag = (DataBag)input.get(0);
  2. Tuple categoryCode = null;
  3. Tuple auxiliary = TupleFactory.getInstance().newTuple(3);
  4. int i = 0;
  5. for(Iterator<Tuple> code=bag.iterator(); code.hasNext();) {
  6. categoryCode=code.next();
  7. auxiliary.set(i, categoryCode.get(0).toString());
  8. i+=1;
  9. }
  10. return auxiliary.toDelimitedString(",");

我希望我的输出在不同的列中如下所示:
2000 1800 2700 2014 1500 1900等我的自定义项给我的输出如下:
200018002700 201415001900等在一个单独的栏中请帮助是否有其他解决方案。请帮忙输入。

6uxekuva

6uxekuva1#

可以按原样返回元组,并在pig脚本中执行展平。

相关问题