我希望有人能帮助我创建一个java udf,它将把这些输入分散在三个文本文件中:
Montreal, 5 3 10 9 8
Toronto, 7 2 2 3 4 4
Edmonton, 3 3 1 1 7
Montreal, 2 2 9
并返回以下输出袋:
{(Montreal,5),(Montreal,3),(Montreal,10),(Montreal,9),(Montreal,8),(Montreal,2),(Montreal,2),(Montreal,9)}
{(Toronto,7),(Toronto,2),(Toronto,2),(Toronto,3),(Toronto,4),(Toronto,4)}
我是java新手,非常感谢您的帮助。谢谢您。
1条答案
按热度按时间cwtwac6a1#
如果您使用的是pig 0.14或更高版本支持strsplittobag,那么
输出