我在pig脚本中有两个load语句,如下所示:
a=使用hcatloader()加载“file1.dat”;
b=使用hcatloader()加载“file2.dat”;
在这些之后,我分别对a和b进行了一些变换。如果我们在批处理模式下运行这个pig脚本,两个文件的加载和转换是顺序进行还是并行进行?我认为pig优化了这个脚本并并行运行了这两个负载。但不是100%确定。有人能对此发表评论吗?
我在pig脚本中有两个load语句,如下所示:
a=使用hcatloader()加载“file1.dat”;
b=使用hcatloader()加载“file2.dat”;
在这些之后,我分别对a和b进行了一些变换。如果我们在批处理模式下运行这个pig脚本,两个文件的加载和转换是顺序进行还是并行进行?我认为pig优化了这个脚本并并行运行了这两个负载。但不是100%确定。有人能对此发表评论吗?
1条答案
按热度按时间px9o7tmv1#
每个load命令将并行运行,但是pig脚本中的命令将串行运行。