应用程序未通过马拉松健康检查的警报

v1uwarro  于 2021-06-26  发布在  Mesos
关注(0)|答案(1)|浏览(354)

我已经为我在马拉松中的所有应用程序配置了http healthchecks,这些应用程序运行得很好,问题是马拉松会不断介入并重新启动一个容器,但它的healthcheck失败,除非我碰巧在马拉松ui中查看,否则我不会知道。
有没有办法检索所有运行状况检查失败的应用程序,以便我可以发送电子邮件警报或类似信息?

r6vfmomb

r6vfmomb1#

marathon通过事件总线公开了有关healthcheck失败的信息,因此您可以编写一个简单的服务来使用marathons healthchecks事件( "eventType": "instance_health_changed_event" )把它翻译成公制,提醒你的名字。
作为参考,我可以推荐allegro/appcop。这是一项可以缩小不健康应用程序的服务。它的代码可以很容易地修改,以满足您的需要。

相关问题