hadoop顺序数据访问

bnl4lu3b 于 2021-06-03 发布在 Hadoop

关注(0)|答案(1)|浏览(472)

根据hadoop权威指南：
hdfs是一个文件系统，用于存储具有流式或顺序数据访问模式的非常大的文件
什么是流式或顺序数据访问？如何减少磁盘的寻道时间？

hadoop hdfs

来源：https://stackoverflow.com/questions/22942072/hadoop-sequential-data-access

1条答案

按热度按时间

iswrvxsc1#

这并不是hadoop特有的。
顺序访问模式是指按顺序读取数据（通常是从头到尾）。以一本书为例。读小说时，你要按顺序读：从第一页开始，然后移到第二页，依此类推。另一种常见的模式称为随机访问。这是当你从一个地方跳到另一个地方，甚至可能是向后阅读数据。举一本书为例，考虑一本字典。你不像读小说那样读。相反，你在中间的某个地方寻找你的词。当你查完这个单词后，你可能会去寻找另一个单词，这个单词离你现在打开书的地方有几百页之遥。寻找你应该从哪里开始阅读被称为“寻找”。
按顺序访问时，只需查找一次，然后读取，直到处理完数据为止。进行随机访问时，每次要切换到文件中的不同位置时，都需要查找。这在硬盘上可能是一个相当大的性能打击，因为寻找是真正昂贵的磁性驱动器。

赞(0）回复(0）举报 2021-06-04

我来回答

hadoop顺序数据访问

1条答案

相关问题

热门标签

最新问答