kubernetes CgroupManager.Exists应该记录确切的验证失败,

ylamdve6  于 10个月前  发布在  Kubernetes
关注(0)|答案(7)|浏览(139)

发生了什么?
在查看 #124313 时,我们试图找出为什么 pcm.Exists 失败的原因,我们意识到在这种情况下不会显示任何日志。
查看 https://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/cm/cgroup_manager_linux.go#L289,cgroup manager 从验证中忽略错误,所以没有人会得到任何线索:(。
你期望发生什么?
错误应该被明确地打印出来。
我们如何尽可能精确地最小化地重现它?
无响应
Kubernetes 版本
从 v1.27 到 master
云提供商
Azure
操作系统版本

  1. # On Linux:
  2. $ cat /etc/os-release
  3. # paste output here
  4. $ uname -a
  5. # paste output here
  6. # On Windows:
  7. C:\> wmic os get Caption, Version, BuildNumber, OSArchitecture
  8. # paste output here

安装工具
容器运行时 (CRI) 和版本(如果适用)
相关插件(CNI,CSI,...)和版本(如果适用)

vdzxcuhz

vdzxcuhz1#

这个问题目前正在等待分类。
如果SIG或子项目确定这是一个相关的问题,他们将通过应用triage/accepted标签并提供进一步的指导来接受它。
组织成员可以通过在评论中写入/triage accepted来添加triage/accepted标签。
有关使用PR评论与我互动的说明,请查看here。如果您对我的行为有任何问题或建议,请针对kubernetes/test-infra仓库提出一个问题。

svdrlsy4

svdrlsy42#

/sig node

f2uvfpb9

f2uvfpb93#

你能贴出你得到的错误信息吗?

rdlzhqv9

rdlzhqv94#

添加错误日志很容易,但它可能会破坏一些用户聚合日志。我们可能希望通过增加详细程度来实现这一点。

6tdlim6h

6tdlim6h5#

@AnishShah,提出这个问题的原因是我不知道我遇到了什么错误,因为即使增加了详细程度,它也从未被记录。请查看代码路径:https://github.com/kubernetes/kubernetes/blob/v1.27.7/pkg/kubelet/kubelet.go#L1805,pcm.Exists一直走到这里,然后忽略了m.Validate(name)返回的任何错误。只要能记录到增加详细程度的错误,我就满意了。

0vvn1miw

0vvn1miw6#

感谢,这是一个有效的问题,我们欢迎任何修复来添加日志记录。但是移除这个bug标签。

klsxnrf1

klsxnrf17#

/assign

相关问题