HDFS是Hadoop中的一个逻辑文件系统,块大小为64MB。HDFS上的文件保存在底层操作系统文件系统上,例如块大小为4KiB的ext4。据我所知,对于本地文件系统上的文件,操作系统使用4KiB块的物理硬盘的起始柱面和结束柱面来检索它。HDFS文件也保存在ext4底层文件系统上。HDFS文件也只能在4KiB块的起始柱面和结束柱面的帮助下检索。如果是这样的话,这不会提高数据检索的速度。现在的问题是,HDFS wrt硬盘中使用了什么技术来提高其检索速度?
smdnsysy1#
从ext文件系统中检索文件的速度并没有改变,正如你所想的那样。但是,如果一个大文件被分割成64Mb的文件块,那么这些文件块被存储在不同的机器上。因此,当进行检索调用时,多台机器同时读取文件块并向主机报告(名称节点)。这样的话,事情就快了。就像十个人在一天内完成一个建筑任务,而不是一个人10天。
1条答案
按热度按时间smdnsysy1#
从ext文件系统中检索文件的速度并没有改变,正如你所想的那样。但是,如果一个大文件被分割成64Mb的文件块,那么这些文件块被存储在不同的机器上。因此,当进行检索调用时,多台机器同时读取文件块并向主机报告(名称节点)。这样的话,事情就快了。就像十个人在一天内完成一个建筑任务,而不是一个人10天。