我想知道是否有可能执行/或提交一个Map的作业在Hadoop集群中执行后,从给定的延迟之前的作业。为了解释清楚,作业提交在一个序列中,并提交作业之前,前一个Map的作业完成执行,假设作业提交到集群每30毫秒至1秒。
gab6jxml1#
你可能想使用Oozie,它是按订单作业的。大多数Hadoop(HDP/CDP)的发行版通常都已经在集群上安装了它。它基本上为Hadoop做工作流管理。(即运行这个作业,然后那个作业,然后 * 那个 * 作业。)(Can像cron job but made to launch on the cluster一样运行)
1条答案
按热度按时间gab6jxml1#
你可能想使用Oozie,它是按订单作业的。大多数Hadoop(HDP/CDP)的发行版通常都已经在集群上安装了它。它基本上为Hadoop做工作流管理。(即运行这个作业,然后那个作业,然后 * 那个 * 作业。)
(Can像cron job but made to launch on the cluster一样运行)