hadoop顺序数据访问

bnl4lu3b  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(472)

根据hadoop权威指南:
hdfs是一个文件系统,用于存储具有流式或顺序数据访问模式的非常大的文件
什么是流式或顺序数据访问?如何减少磁盘的寻道时间?

iswrvxsc

iswrvxsc1#

这并不是hadoop特有的。
顺序访问模式是指按顺序读取数据(通常是从头到尾)。以一本书为例。读小说时,你要按顺序读:从第一页开始,然后移到第二页,依此类推。另一种常见的模式称为随机访问。这是当你从一个地方跳到另一个地方,甚至可能是向后阅读数据。举一本书为例,考虑一本字典。你不像读小说那样读。相反,你在中间的某个地方寻找你的词。当你查完这个单词后,你可能会去寻找另一个单词,这个单词离你现在打开书的地方有几百页之遥。寻找你应该从哪里开始阅读被称为“寻找”。
按顺序访问时,只需查找一次,然后读取,直到处理完数据为止。进行随机访问时,每次要切换到文件中的不同位置时,都需要查找。这在硬盘上可能是一个相当大的性能打击,因为寻找是真正昂贵的磁性驱动器。

相关问题