这是我的监控配置:
监控项目: 异常
阈值: 1
报警间隔时间(秒): 30
发送人KEY: xxx
开始自动恢复: 是 否
触发自动恢复阀值: 1
描述:
异常自动恢复
发生的异常:
序号 | Channel信息 | Pipline信息 | Node信息 | 日志标题 | 日志内容 | 发生时间 |
---|---|---|---|---|---|---|
7333 | 中国 <-> 新加坡 | 新加坡 -> 中国 | manager | EXCEPTION | 点击查看详细信息 | 2018-01-01 20:17:03 |
7330 | 中国 <-> 新加坡 | 新加坡 -> 中国 | manager | EXCEPTION | 点击查看详细信息 | 2018-01-01 20:16:12 |
7327 | 中国 <-> 新加坡 | 新加坡 -> 中国 | 5 | EXCEPTION | 点击查看详细信息 | 2018-01-01 20:15:29 |
7326 | 中国 <-> 新加坡 | 新加坡 -> 中国 | 1 | EXCEPTION | 点击查看详细信息 | 2018-01-01 20:15:22 |
目前每次点击解挂它也能重新开始,问题不是很大,但是就是很繁琐。
请帮忙告知下如何正确配置监控自动恢复。
2条答案
按热度按时间iqxoj9l91#
特别是
监控项目
阈值
触发自动恢复阀值
这几个参数如何调整;文档内容太少了,不确定怎么配置。k4aesqcs2#
ERROR,EXCEPTION@00:00-03:00,03:00-24:00
这样?我猜的
其实 有一键添加的:
[异常 ERROR,EXCEPTION]
[Position超时 600]
[延迟 600]
[Process超时 60]
源码里面是这么写的:
if (!inPeriod(rule)) {
return;
}
StringUtils.substringBeforeLast(matchValue, "@");
inPeriod 里面是 String periods = StringUtils.substringAfterLast(rule, "@"); 取@后段的数据
用来判定是否是时间区间。
substringBeforeLast 取@前段的数据 用来比大小(异常那里是用来比找关键字)
so 我猜 可以这么写
[异常 ERROR,EXCEPTION@03:00-24:00]
[Position超时 6000@03:00-24:00]
[延迟 6000@03:00-24:00]
[Process超时 6000@03:00-24:00]