为什么kafka索引文件使用内存Map文件，而日志文件不使用？

s4n0splo 于 2021-06-07 发布在 Kafka

关注(0)|答案(4)|浏览(700)

我们知道kafka使用内存Map文件作为索引文件，但是它的日志文件不使用内存Map文件技术。
我的问题是为什么索引文件使用内存Map文件，而日志文件不使用？

来源：https://stackoverflow.com/questions/48665257/why-kafka-index-files-use-memory-mapped-files-but-log-files-dont

4条答案

按热度按时间

在只附加写的数据库中，使用快速索引来提高读性能是一种常见的优化方法（几乎所有lstm数据库都会这样做）。也正如其他人所指出的：
索引是稀疏的，所以内存占用更小。即使索引的稀疏性也是可配置的，这在数据增长时也很有用。
只附加写模式比随机寻道更快（对于ssd尤其如此），因此在优化时不需要太多注意。

赞(0）回复(0）举报 2021-06-07

可以Map到内存中的字节数与地址空间有关。例如，32位体系结构只能处理4gb甚至更小的文件部分。Kafka日志通常足够大，可能一次只Map部分，因此使读取变得复杂。
但是，索引文件是稀疏的，这意味着它们的大小相对较小。将它们Map到内存可以加快查找过程，这是内存Map文件提供的主要好处。

赞(0）回复(0）举报 2021-06-07

日志是存储消息的地方，索引文件指向日志中的位置。
有一个很好的，丰富多彩的博客文章，解释是怎么回事。

赞(0）回复(0）举报 2021-06-07

用mmap方法实现日志和索引并置会带来数据一致性问题。mmap不能100%保证将数据从内存刷新到文件（假设操作系统上的flush应答而不是显式调用munmap（2）），如果索引更新被刷新，但是由于某种原因日志数据没有被成功刷新，那么日志中的数据就不能再被理解了。
顺便说一句，对于一个只追加的数据，在写的方向上，我们只需要关心下一个写块（buffer），所以庞大的数据应该不会影响这一点。

赞(0）回复(0）举报 2021-06-07

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 5个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 5个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 5个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 5个月前