kubernetes 无法检查ETCD群集运行状况

7eumitmz 于 2023-04-11 发布在 Kubernetes

关注(0)|答案(1)|浏览(319)

在遵循（https://kubernetes.io/docs/setup/production-environment/tools/kubeadm/setup-ha-etcd-with-kubeadm/）关于HA外部ETCD的官方指导后，我试图检查etcd集群的健康状态，但是，它抛出了一些我正在努力解决的错误。请帮助。

检查etcd集群健康的命令，出现错误：

docker run --rm -it \
--net host \
-v /etc/kubernetes:/etc/kubernetes k8s.gcr.io/etcd:3.4.3-0 etcdctl \
--cert /etc/kubernetes/pki/etcd/peer.crt \
--key /etc/kubernetes/pki/etcd/peer.key \
--cacert /etc/kubernetes/pki/etcd/ca.crt \
--endpoints https://${HOST0}:2379 endpoint health --cluster

三个裸机主机，所有ufw启用，2379和2380端口上允许整个主机。

错误：

Error: failed to fetch endpoints from etcd cluster member list: context deadline exceeded ```

**etcd docker image**:
``` k8s.gcr.io/etcd     3.4.3-0             303ce5db0e90        9 months ago        288MB ````

kubernetes

来源：https://stackoverflow.com/questions/63289800/unable-to-check-etcd-cluster-health

1条答案

按热度按时间

crcmnpdw1#

Context deadline exceeded是grpc客户端在无法建立连接时返回的不清楚的错误。您可以设置ETCDCTL_API=2，然后您可以获得正确的错误消息。
此外，您可以更改etcd中的一些代码来调试此错误。
参见#10087
当我应用正确的证书/密钥对时，您可以解决这个问题。
假设你使用kubeadm来启动集群，在文件夹下应该有几个cert/key对：

# ls -l /etc/kubernetes/pki/etcd/
total 32
-rw-r--r--    1 root     root          1017 Nov 12 15:32 ca.crt
-rw-------    1 root     root          1679 Nov 12 15:32 ca.key
-rw-r--r--    1 root     root          1094 Nov 12 15:32 healthcheck-client.crt
-rw-------    1 root     root          1675 Nov 12 15:32 healthcheck-client.key
-rw-r--r--    1 root     root          1180 Nov 12 15:32 peer.crt
-rw-------    1 root     root          1675 Nov 12 15:32 peer.key
-rw-r--r--    1 root     root          1180 Nov 12 15:32 server.crt
-rw-------    1 root     root          1679 Nov 12 15:32 server.key

# etcdctl --version
etcdctl version: 3.3.1
API version: 2

# ETCDCTL_API=3 etcdctl snapshot save snapshot.db \
  --cacert /etc/kubernetes/pki/etcd/ca.crt \
  --cert /etc/kubernetes/pki/etcd/server.crt \
  --key /etc/kubernetes/pki/etcd/server.key
Snapshot saved at snapshot.db

# ETCDCTL_API=3 etcdctl --write-out=table snapshot status snapshot.db
+----------+----------+------------+------------+
|   HASH   | REVISION | TOTAL KEYS | TOTAL SIZE |
+----------+----------+------------+------------+
| b9d500f7 |    72966 |       1194 |     4.9 MB |

您也可以尝试遵循此指令error-context-deadline-exceeded-accessing。
看一看：context-deadline-exceeded.

赞(0）回复(0）举报 2023-04-11

我来回答

kubernetes 无法检查ETCD群集运行状况

1条答案

相关问题

热门标签

最新问答