map reduce的顺序和并行执行

hmtdttj4  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(355)

我是hadoop的新手,在下面的场景中需要帮助。假设有5个乔布斯先生

  1. P1(MR1+ MR2 ) -->// MR1 and MR2 run sequentially
  2. P2(MR3+MR4)// // MR3 and MR4 run sequentially
  3. and P1 and P2 run parallel way .Output of P1 and P2 will be joined By MR5.

如何在hadoop中定义这种复杂的工作流?

dsf9zpds

dsf9zpds1#

如果您有更复杂的需求,您应该看看oozie:oozie
对于简单的需求,可以在作业api中使用依赖关系管理。

相关问题