这是一个从构建基础设施收集关键操作指标的跟踪问题。这些指标被收集的原因如下:
- 当问题出现时,提高根因分析的速度。
- 了解更改如何与性能变化相关联。
- 促进可能的优化关键领域。
- 促进对指标的监控和警报。
一旦确定了关键指标的详细列表,以下任务列表将被附加到其中。
- 收集指标
- 创建 Jmeter 板
- GCP 聚合服务API指标
- AWS 聚合服务API
- GitHub 聚合服务API
- Gerrit 聚合服务API
- TLS证书生命周期
- 一般操作系统/应用程序/容器特定指标
协调器
- 等待虚拟机配额的时间
- 按阶段和类型创建构建器的延迟
- 总构建器创建延迟
- VM示例创建失败
- 示例创建队列深度
- 示例创建队列延迟
- 活动Trybot计数、延迟、按类型失败的数量
- 按池分配的构建器计数
- 按类型分配的待处理构建计数
- 按类型分配的待处理构建延迟
- 正常运行时间
- 构建速率
- 一般API仪器(如ochttp)
Gomote
- 创建的会话数
- 销毁的会话数
- 会话持续时间
- 命令使用情况(SSH、put等)
@golang/release
2条答案
按热度按时间ryhaxcpt1#
https://go.dev/cl/410016提到了这个问题:
cmd/coordinator: only expose /metrics in dev mode
pgpifvop2#
https://go.dev/cl/410015提到了这个问题:
internal/coordinator: measure GetBuildlet latency