kubernetes expect kubelet retry to alloc resource when device plugin restart

qcbq4gxm  于 5个月前  发布在  Kubernetes
关注(0)|答案(4)|浏览(126)

发生了什么?
当设备插件重启时,pod创建失败,原因是UnexpectedAdmissionError。
你期望会发生什么?
kubelet会重试等待设备插件重启,以便让pod创建成功。
我们如何尽可能精确地最小化地重现它?

  1. 准备设备插件报告资源。
  2. 创建pod,同时设备插件重启。
    我们需要了解其他任何信息吗?
  • 无响应*

Kubernetes版本:

$ kubectl version
# paste output here

云提供商:
操作系统版本:

# On Linux:
$ cat /etc/os-release
# paste output here
$ uname -a
# paste output here

# On Windows:
C:\> wmic os get Caption, Version, BuildNumber, OSArchitecture
# paste output here

安装工具:
容器运行时(CRI)和版本(如果适用):
相关插件(CNI,CSI等)和版本(如果适用):

jogvjijk

jogvjijk1#

/triage accepted
/priority important-longterm
在我看来,这已经足够接近#109595了。如果没有相关的修复,kubelet将在设备实际可用之前接受工作负载,这可以说是更糟糕的。
实际上,kubelet可以在一些众所周知的可恢复场景中重试准入,我们已经在讨论这个可能的增强:#109595(评论)

hfwmuf9z

hfwmuf9z4#

这个问题已经超过一年没有更新了,应该重新进行优先级评估。
你可以:

  • 确认这个问题仍然与 /triage accepted (仅组织成员)相关
  • /close 关闭这个问题

有关优先级评估过程的更多详细信息,请参见 https://www.kubernetes.dev/docs/guide/issue-triage/
已接受移除优先级评估

相关问题