我与pig的关系如下:test=file::field1:chararray,x::y:{(z:chararray)}例如:测试=a,({(a),(b),(c),(d)})我想检查行李x中是否存在field1值(即a)。如何实现这一点在Pig?
6kkfgxo01#
我发现在Pig身上没有办法做到这一点。我将field和bag都传递给python udf,并在那里进行匹配,如下所示:
@outputSchema('matchindx:int') def pythudf(field1,bag): for word in bag: if (word[0] == field1): return 1 return 0
1条答案
按热度按时间6kkfgxo01#
我发现在Pig身上没有办法做到这一点。我将field和bag都传递给python udf,并在那里进行匹配,如下所示: