如何精确模拟prem hadoop配置到gcp dataproc

o7jaxewo  于 2021-05-27  发布在  Hadoop
关注(0)|答案(1)|浏览(320)

dataproc实际上是gcp上的一种apachehadoop。我需要一些集群配置方面的明确性。假设我在prem hadoop集群上配置了1个namenode和n个datanode。我是否需要在dataproc上有1个主节点和n个工作节点。我还想利用dataproc的自动伸缩特性。在将on-prem hadoop基础设施迁移到gcp dataproc时,我们是否有需要遵循的标准清单?

cmssoen2

cmssoen21#

没有要求dataproc集群与on-prem配置完全匹配:事实上,dataproc的优点之一是可以根据需要重新缩放集群以匹配工作负载。
gcp有一个关于在premhadoop上迁移到dataproc的详细指南。

相关问题