我正在尝试运行一个关于维基百科页面统计数据的pig脚本。首先,我只是做了一个基本的过滤器,比如:
A = LOAD '/data' using PigStorage(' ') as (project:chararray, page:chararray, requests:int, size:int);
B= FILTER A BY project == 'en';
dump B;
这是正常工作,如果我加载2-3个文件,但错误了,如果我加载所有的文件。错误是:
org.apache.pig.impl.logicalayer.frontendexception:错误1066:无法打开别名b的迭代器
为了确认没有损坏的记录,我复制了几个正在运行的文件,并运行了上面的脚本,但没有成功。请告知!
暂无答案!
目前还没有任何答案,快来回答吧!