这个部署已经正常运行了几个月了。看起来像是今天早上重新部署的Pod,我想可能与应用2023.10.31 (AKSSecurityPatchedVHD
有关。
挂载Azure文件以进行文件存储的Pod在ContainerCreating
中卡住,并出现以下错误:
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal Scheduled 3m46s default-scheduler Successfully assigned env/<deployment> to <aks-node>
Warning FailedMount 3m45s (x2 over 3m46s) kubelet MountVolume.MountDevice failed for volume "<pvc>" : rpc error: code = Internal desc = volume(<resource-group>) mount //<stuff>.file.core.windows.net/<pvc> on /var/lib/kubelet/plugins/kubernetes.io/csi/file.csi.azure.com/<stuff>/globalmount failed with mount failed: exit status 32
Mounting command: mount
Mounting arguments: -t cifs -o mfsymlinks,actimeo=30,nosharesock,file_mode=0777,dir_mode=0777,<masked> //<stuff>.file.core.windows.net/<pvc> /var/lib/kubelet/plugins/kubernetes.io/csi/file.csi.azure.com/<stuff>/globalmount
Output: mount error: cifs filesystem not supported by the system
mount error(19): No such device
Refer to the mount.cifs(8) manual page (e.g. man mount.cifs) and kernel log messages (dmesg)
Please refer to http://aka.ms/filemounterror for possible causes and solutions for mount errors.
Warning FailedMount 104s kubelet Unable to attach or mount volumes: unmounted volumes=[file-storage], unattached volumes=[file-storage kube-api-access-xbprr]: timed out waiting for the condition
字符串
有点难住了。我试过:
- 重新部署pod部署
- 重新部署存储
- 证实了所提到的PVC确实存在
问题仍然存在,我不知道下一步该怎么做,除了重新部署一切。
在http://aka.ms/filemounterror上没有任何有用的东西。几个月来环境中没有任何变化。另一个环境运行良好,它基本上是这个环境的副本,所以似乎与这个环境隔离。这些是Linux节点。
我的storage.yaml
:
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: file-storage
namespace: env
spec:
accessModes:
- ReadWriteMany
storageClassName: azurefile
resources:
requests:
storage: 25Gi
---
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: postgres-storage
namespace: env
spec:
accessModes:
- ReadWriteOnce
storageClassName: default
resources:
requests:
storage: 25Gi
型postgres-storage
似乎很好,这是file-storage
是一个问题。
2条答案
按热度按时间djmepvbi1#
这对我们的AKS没有影响,但对我们Azure租户中的其他VM有影响;似乎there is an issue with the CIFS module没有包含在MS内核构建中
在6.2.0-1015和6.2.0-1016之间,CIFS模块已从fs/cifs/* 移动到fs/smb/client/、fs/smb/common/ 和fs/smb/server/*。包含列表(root/debian.azure-6.2/control.d/azure.inclusion-list)未针对此更改进行更新,因此该模块未包含在linux-modules-6.2.0-1026-azure软件包中。
我不知道为什么它没有影响Kubernetes版本1.27.3;也许MS还没有将其移动到6.2.0.1206内核?
已发布解决方案:
字符串
yb3bgrhw2#
两个环境都运行在
kubectl=1.26.6
上。将有问题的一个升级到1.27.3
并修复了它。为什么一个环境有问题,而另一个没有,我不确定。