dataproc实际上是gcp上的一种apachehadoop。我需要一些集群配置方面的明确性。假设我在prem hadoop集群上配置了1个namenode和n个datanode。我是否需要在dataproc上有1个主节点和n个工作节点。我还想利用dataproc的自动伸缩特性。在将on-prem hadoop基础设施迁移到gcp dataproc时,我们是否有需要遵循的标准清单?
dataproc实际上是gcp上的一种apachehadoop。我需要一些集群配置方面的明确性。假设我在prem hadoop集群上配置了1个namenode和n个datanode。我是否需要在dataproc上有1个主节点和n个工作节点。我还想利用dataproc的自动伸缩特性。在将on-prem hadoop基础设施迁移到gcp dataproc时,我们是否有需要遵循的标准清单?
1条答案
按热度按时间cmssoen21#
没有要求dataproc集群与on-prem配置完全匹配:事实上,dataproc的优点之一是可以根据需要重新缩放集群以匹配工作负载。
gcp有一个关于在premhadoop上迁移到dataproc的详细指南。