我们的hadoop集群中有两种类型的作业。一个作业使用mapreduce hbase扫描,另一个只是在hdfs中纯操作原始文件。在我们的hdfs集群中,部分数据节点也是hbase区域服务器,但其他节点不是。我们希望只在RegionServer中运行hbase扫描(以利用数据位置),并在所有DataNode中运行其他类型的作业。这个想法可能吗?我们可以指定在mapreduce作业配置中使用哪些TaskTracker吗?感谢您的帮助。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!