kubernetes 所有调用kl.killPod的调用都应该被明确地记录下来,对于cgroups-per-qos代码路径,这一步并未完成,

jv2fixgn  于 10个月前  发布在  Kubernetes
关注(0)|答案(3)|浏览(85)

发生了什么?
你好。
我们正在调查一个pod循环崩溃问题,导致没有给出原因/上下文的日志:

  1. kuberuntime_container.go:742] "Killing container with a grace period" pod="<>" podUID=<> containerName="kube-proxy" containerID="containerd://<>" gracePeriod=30

在给定的情况下,我们最终找到了以下代码可能是唯一的地方,在SyncPod中没有任何周围的解释来说明为什么只要killPod不失败就会杀死它:https://github.com/kubernetes/kubernetes/blob/v1.27.7/pkg/kubelet/kubelet.go#L1805。值得一提的是,我找不到任何方法来打印kuberuntime_container.go:742中的调用堆栈,尽管klog应该提供-log_backtrace_at,但我在kubelet选项中找不到它。

期望发生什么?

所有对kl.killPod的调用都应该被明确记录。

我们如何尽可能精确地重现它?

我无法重现我正在查看的问题,但描述应该足够明显和合理。

我们需要了解其他信息吗?

  • 无响应*

Kubernetes版本

v1.27.7

云提供商

Azure

OS版本

  1. # On Linux:
  2. $ cat /etc/os-release
  3. # paste output here
  4. $ uname -a
  5. # paste output here
  6. # On Windows:
  7. C:\> wmic os get Caption, Version, BuildNumber, OSArchitecture
  8. # paste output here

安装工具

容器运行时(CRI)和版本(如适用)

相关插件(CNI,CSI等)和版本(如适用)

8mmmxcuj

8mmmxcuj1#

这个问题目前正在等待分类。
如果SIG或子项目确定这是一个相关的问题,他们将通过应用triage/accepted标签并提供进一步的指导来接受它。
组织成员可以通过在评论中写入/triage accepted来添加triage/accepted标签。
有关使用PR评论与我互动的说明,请查看here。如果您对我的行为有任何问题或建议,请针对kubernetes/test-infra仓库提出一个问题。

x7yiwoj4

x7yiwoj42#

这是与我们一起调查的一个问题有关的,当时pod被杀死,但不清楚原因是什么。
/sig node

btqmn9zl

btqmn9zl3#

感谢您的反馈,我们欢迎对此问题进行修复,但不建议移除bug标签。

相关问题