我搜索了很多网站和文章,但没有找到任何完美的答案。我使用的是EKS版本1.18。我可以看到一些Pod被“驱逐”,但当尝试检查节点时,我可以看到错误“(来自类似事件的组合):无法垃圾收集所需数量的图像。想要释放6283487641字节,但释放了0字节”。
我们有没有办法找到失败的原因?或者如何解决这个问题?我们非常欢迎您的建议。
我可以看到磁盘覆盖文件系统在几个小时内几乎满了。我不知道发生了什么事。下面的屏幕截图显示了我的内存利用率。
我搜索了很多网站和文章,但没有找到任何完美的答案。我使用的是EKS版本1.18。我可以看到一些Pod被“驱逐”,但当尝试检查节点时,我可以看到错误“(来自类似事件的组合):无法垃圾收集所需数量的图像。想要释放6283487641字节,但释放了0字节”。
我们有没有办法找到失败的原因?或者如何解决这个问题?我们非常欢迎您的建议。
我可以看到磁盘覆盖文件系统在几个小时内几乎满了。我不知道发生了什么事。下面的屏幕截图显示了我的内存利用率。
2条答案
按热度按时间euoag5mw1#
看看您是否可以更改Kubernetes GC策略。我猜这些问题可能是由于最近国旗的变化
新的是使用标志作为
--eviction
语法,您能检查一下是不是您的设置导致清除空间失败请参考此处的文档
https://kubernetes.io/docs/concepts/cluster-administration/kubelet-garbage-collection/
3mpgtkmj2#
我的本地k3d集群也有同样的问题,原来我的空间很小,我有一大堆悬而未决的映像https://docs.docker.com/engine/reference/commandline/image_prune/并运行
docker image prune -a
,然后重新创建集群为我修复了它。