根据hadoop权威指南:hdfs是一个文件系统,用于存储具有流式或顺序数据访问模式的非常大的文件什么是流式或顺序数据访问?如何减少磁盘的寻道时间?
iswrvxsc1#
这并不是hadoop特有的。顺序访问模式是指按顺序读取数据(通常是从头到尾)。以一本书为例。读小说时,你要按顺序读:从第一页开始,然后移到第二页,依此类推。另一种常见的模式称为随机访问。这是当你从一个地方跳到另一个地方,甚至可能是向后阅读数据。举一本书为例,考虑一本字典。你不像读小说那样读。相反,你在中间的某个地方寻找你的词。当你查完这个单词后,你可能会去寻找另一个单词,这个单词离你现在打开书的地方有几百页之遥。寻找你应该从哪里开始阅读被称为“寻找”。按顺序访问时,只需查找一次,然后读取,直到处理完数据为止。进行随机访问时,每次要切换到文件中的不同位置时,都需要查找。这在硬盘上可能是一个相当大的性能打击,因为寻找是真正昂贵的磁性驱动器。
1条答案
按热度按时间iswrvxsc1#
这并不是hadoop特有的。
顺序访问模式是指按顺序读取数据(通常是从头到尾)。以一本书为例。读小说时,你要按顺序读:从第一页开始,然后移到第二页,依此类推。另一种常见的模式称为随机访问。这是当你从一个地方跳到另一个地方,甚至可能是向后阅读数据。举一本书为例,考虑一本字典。你不像读小说那样读。相反,你在中间的某个地方寻找你的词。当你查完这个单词后,你可能会去寻找另一个单词,这个单词离你现在打开书的地方有几百页之遥。寻找你应该从哪里开始阅读被称为“寻找”。
按顺序访问时,只需查找一次,然后读取,直到处理完数据为止。进行随机访问时,每次要切换到文件中的不同位置时,都需要查找。这在硬盘上可能是一个相当大的性能打击,因为寻找是真正昂贵的磁性驱动器。