我们能在一台单节点机器上并行运行多个拆分吗?

1u4esq0p  于 2021-05-27  发布在  Hadoop
关注(0)|答案(1)|浏览(436)

我在单节点计算机上使用hadoop。当我运行一个大小为1gb的大文件时,拆分大小为128mb。因此,它以8个拆分运行文件,但这些拆分按顺序运行意味着一个拆分在另一个拆分完成后开始执行。我们是否必须设置任何属性值才能在单节点计算机上并行运行拆分。

ctehm74n

ctehm74n1#

Hadoop 提供分布式处理框架( batch ),即。 MapReduce ,它并行执行任务。但是并行性的级别取决于集群中的机器数量。并行性也可以通过 input split size 但是,由于您有一个独立的设置,因此无法实现并行性。

相关问题