hadoop 执行多个Map的作业,这些作业按一定的延迟顺序执行

qcuzuvrc  于 2022-11-01  发布在  Hadoop
关注(0)|答案(1)|浏览(159)

我想知道是否有可能执行/或提交一个Map的作业在Hadoop集群中执行后,从给定的延迟之前的作业。为了解释清楚,作业提交在一个序列中,并提交作业之前,前一个Map的作业完成执行,假设作业提交到集群每30毫秒至1秒。

gab6jxml

gab6jxml1#

你可能想使用Oozie,它是按订单作业的。大多数Hadoop(HDP/CDP)的发行版通常都已经在集群上安装了它。它基本上为Hadoop做工作流管理。(即运行这个作业,然后那个作业,然后 * 那个 * 作业。)
(Can像cron job but made to launch on the cluster一样运行)

相关问题