我有一个由terraform生成的Datadog监视器。主要查询如下:
sum(last_1m):avg:app.application.health{application.health:healthy,cluster_name:${local.eks_cluster_name},!source:api-service-full} by {source}.as_count() < 60"
问题在于系统重启后,{source}容器更改了其名称。
例如,从app-tier-1-1abc-agent
到应用程序层1-定义2-代理
Datadog不会更新或删除旧监视器,而是创建新监视器,并使旧监视器处于警报和N/A状态。
还有什么可以改进的吗?所有的想法都很感谢,谢谢!
1条答案
按热度按时间rsaldnfx1#
通过发送API调用来编辑关闭和启动时的每个监视器查询,解决了此问题。
我做了一个非常笨拙的bash脚本,因为我找不到一种方法来在bash的变量中存储curl的数据,但是如果使用其他脚本语言,这可以用更少的代码完成,例如用于2个监视器
然后,只需删除启动时的虚拟查询值,它将拿起您的新显示器,而忘记不存在的