你想添加什么内容?
我建议通过包含PodPriority信息来增强调度器的preemption_victims指标。这个新增将提供更详细的抢占过程洞察,帮助了解哪些pod正在被抢占以及原因,基于它们的优先级。
kubernetes/pkg/scheduler/metrics/metrics.go
d61cbac中的第86行到第94行
| | PreemptionVictims=metrics.NewHistogram( |
| | &metrics.HistogramOpts{ |
| | Subsystem: SchedulerSubsystem, |
| | Name: "preemption_victims", |
| | Help: "Number of selected preemption victims", |
| | // we think #victims>64 is pretty rare, therefore [64, +Inf) is considered a single bucket. |
| | Buckets: metrics.ExponentialBuckets(1, 2, 7), |
| | StabilityLevel: metrics.STABLE, |
| | }) |
为什么需要这样做?
在preemption_victims指标中包含PodPriority对于提供调度器决策过程的更完整视图至关重要。目前,这些指标提供了被抢占pod的数量,但缺乏关于它们优先级的详细信息。通过这个增强,管理员和开发人员可以更好地分析抢占模式和优先级,从而做出更明智的决策,并可能提高集群效率和调度公平性。
7条答案
按热度按时间8yparm6h1#
/assign
uoifb46i2#
这个问题目前正在等待分类。
如果SIG或子项目确定这是一个相关的问题,他们将通过应用
triage/accepted
标签并提供进一步的指导来接受它。组织成员可以通过在评论中写入
/triage accepted
来添加triage/accepted
标签。有关使用PR评论与我互动的说明,请查看here。如果您对我的行为有任何问题或建议,请针对kubernetes/test-infra仓库提出一个问题。
q3qa4bjr3#
/sig scheduling
bzzcjhmw4#
感谢@sanposhiho的建议。
为@kerthcet加1分。
我同意这个指标很有价值,让我们在关闭这个PR的同时保留#122046。
如果我们收到相同的反馈,或者我们有另一个关于这个指标的功能请求,那么我们可以考虑创建一个新的指标来最终取代这个指标。
zysjyyx45#
Kubernetes项目目前缺乏足够的贡献者来充分应对所有问题。
此机器人根据以下规则对未分类的问题进行分级处理:
lifecycle/stale
应用后的90天不活动后,将应用lifecycle/stale
lifecycle/stale
应用后的30天不活动后,将应用lifecycle/rotten
lifecycle/rotten
应用后的30天不活动后,该问题将被关闭您可以:
/remove-lifecycle stale
/close
关闭此问题请将反馈发送至sig-contributor-experience@kubernetes/community。
/lifecycle stale
vatpfxk56#
/remove-lifecycle stale
mbzjlibv7#
Kubernetes项目目前缺乏足够的贡献者来充分应对所有问题。
此机器人根据以下规则对未分类的问题进行分级处理:
lifecycle/stale
应用后的90天不活动后,将应用lifecycle/stale
lifecycle/stale
应用后的30天不活动后,将应用lifecycle/rotten
lifecycle/rotten
应用后的30天不活动后,该问题将被关闭您可以:
/remove-lifecycle stale
/close
关闭此问题请将反馈发送至sig-contributor-experience@kubernetes/community。
/lifecycle stale