我是一个年轻的研究人员,计划购买一个计算服务器(可能是“大”)数据分析。服务器将有20tb的硬盘空间。我现在的问题是我应该使用普通的linux文件系统还是hadoop hdfs作为系统。有人能解释一下这两种选择的利弊吗?
kpbwa7wx1#
在单个节点(一台服务器)上使用hdfs是没有意义的。hdfs的全部内容是分发数据,以便计算任务能够接近数据运行,并拥有数据的冗余副本,以便能够容忍硬件故障。单个节点不会提供任何hdfs好处。如果你有一组机器(如10台服务器),那么是的,你可以问这个问题。实际上,hdfs不是一个选项。
1条答案
按热度按时间kpbwa7wx1#
在单个节点(一台服务器)上使用hdfs是没有意义的。hdfs的全部内容是分发数据,以便计算任务能够接近数据运行,并拥有数据的冗余副本,以便能够容忍硬件故障。单个节点不会提供任何hdfs好处。如果你有一组机器(如10台服务器),那么是的,你可以问这个问题。实际上,hdfs不是一个选项。