我刚开始阅读Hadoop,偶然发现了CAP定理。你能解释一下CAP的哪两个组件适用于HDFS系统吗?
y4ekin9u1#
这份文件很清楚地说:“Hadoop文件系统的一致性模型是单拷贝更新语义;即传统本地POSIX文件系统。”(单副本更新语义意味着,访问或更新给定文件的所有进程所看到的文件内容看起来就像只存在该文件的一个副本。)接下来,该文件指出:
上述特征表明HDFS中存在“一致性”。来源:https://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/filesystem/introduction.html
HDFS可为命名节点和数据节点提供高可用性。来源:https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithNFS.html
文档中(在“操作和故障”章节下)明确提到:“完成操作的时间未定义,可能取决于实现和系统状态。”这表明HDFS中缺少CAP上下文中的“可用性”。来源:https://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/filesystem/introduction.html
7eumitmz2#
谈到Hadoop,它支持可用性和分区容差属性。不支持一致性属性,因为只有namenode才有副本放置位置的信息。此信息不适用于集群的每个节点。
2条答案
按热度按时间y4ekin9u1#
一致性参数
这份文件很清楚地说:“Hadoop文件系统的一致性模型是单拷贝更新语义;即传统本地POSIX文件系统。”
(单副本更新语义意味着,访问或更新给定文件的所有进程所看到的文件内容看起来就像只存在该文件的一个副本。)
接下来,该文件指出:
上述特征表明HDFS中存在“一致性”。
来源:https://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/filesystem/introduction.html
分区容差参数
HDFS可为命名节点和数据节点提供高可用性。
来源:https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithNFS.html
缺少可用性的参数
文档中(在“操作和故障”章节下)明确提到:
“完成操作的时间未定义,可能取决于实现和系统状态。”
这表明HDFS中缺少CAP上下文中的“可用性”。
来源:https://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/filesystem/introduction.html
7eumitmz2#
谈到Hadoop,它支持可用性和分区容差属性。不支持一致性属性,因为只有namenode才有副本放置位置的信息。此信息不适用于集群的每个节点。