Cassandra在9:54突然崩溃,但在system.log中没有9:52之后的信息。cassandra-system.log
我们的Cassandra版本是3.11.10,我们运行instaclustr/cassandra-exporter作为独立服务器来监控Cassandra,但我们无法获得任何异常信息来查找原因。下面是JVM HEAP使用的变化。JVM HEAP usage
我们一直不知道原因。
一开始我们以为是OOM-kill,但/var/log/message中并没有kill进程,同时启动Cassandra时根据WARN信息修改了vm.max_map_count = 1048575,现在这些WARN消息还在,不知道是否与Cassandra crash有关。Setup Cassandra WARNING
有谁能帮忙给给予一些想法或解决办法,谢谢!
1条答案
按热度按时间xzabzqsa1#
给出警告消息后,看起来此节点上有几个设置不符合规范。
你需要检查一下文档,确保应用了推荐的设置,特别是,我建议禁用交换空间。
编辑
/etc/fstab
并注解掉包含单词“swap”的行。这将在重新引导后生效,因此运行sudo swapoff -a
以在当前会话中禁用它。还有,这是一个相当长的“本地暂停”时间。是否有任何GC.log文件要检查?也许打开GC日志记录来查看那里发生了什么。这也可能是一个非常糟糕的查询的结果。
无论如何,浏览上面链接的文档,重新启动节点,看看是否有任何改进。我会从那里开始。