我从cloudera manager收到这些警报。journal\u node\u fsync\u延迟的健康测试结果令人担忧:前一分钟的第99百分位fsync延迟为2.3秒。警告阈值:1秒。我查看了cloudera文档,它显示1sec是警告,3sec是关键。这个问题的原因是什么?如何解决?
k5ifujac1#
原因;journalnode fsync latency“日志\u节点\u fsync \u延迟”这是一个journalnode运行状况测试,用于检查journalnode的fsync延迟。如果前一分钟的第99百分位fsync延迟高于配置的阈值,则此测试返回“坏”运行状况。fsync性能差可能表示磁盘损坏或过载(即journalnode与namenode和datanode共享同一磁盘),并会对namenode执行的hdfs元数据操作的性能产生负面影响。如何解决这个问题;在受影响的节点上,使用iostat监视磁盘;或者将journalnode内容移动到单独的磁盘上。
1条答案
按热度按时间k5ifujac1#
原因;journalnode fsync latency“日志\u节点\u fsync \u延迟”
这是一个journalnode运行状况测试,用于检查journalnode的fsync延迟。如果前一分钟的第99百分位fsync延迟高于配置的阈值,则此测试返回“坏”运行状况。fsync性能差可能表示磁盘损坏或过载(即journalnode与namenode和datanode共享同一磁盘),并会对namenode执行的hdfs元数据操作的性能产生负面影响。
如何解决这个问题;在受影响的节点上,使用iostat监视磁盘;或者将journalnode内容移动到单独的磁盘上。