最近更新时间:2024-06-06 19:58:47
集群运行过程中,您需注意避免如下高危操作,以下说明了高危操作可能导致的后果及误操作后解决方案。
分类 | 高危操作 | 导致后果 | 误操作解决方案 |
master 及 etcd 节点 | 修改集群内节点安全组 | 可能导致 master 节点无法使用 | 按照官网推荐配置放通安全组 |
节点到期或被销毁 | 该 master 节点不可用 | 不可恢复 | |
重装操作系统 | master 组件被删除 | 不可恢复 | |
自行升级 master 或者 etcd 组件版本 | 可能导致集群无法使用 | 回退到原始版本 | |
删除或格式化节点 /etc/kubernetes 等核心目录数据 | 该 master 节点不可用 | 不可恢复 | |
更改节点 IP | 该 master 节点不可用 | 改回原 IP | |
自行修改核心组件(etcd、kube-apiserver、docker 等)参数 | 可能导致 master 节点不可用 | 回退至默认参数 | |
自行更换 master 或 etcd 证书 | 可能导致集群不可用 | 不可恢复 | |
worker 节点 | 修改集群内节点安全组 | 可能导致节点无法使用 | 按照官网推荐配置放通安全组 |
调整节点实例规格 | 机器强制关机,节点不可用 | 节点移出再加入集群 | |
节点到期或被销毁 | 该节点不可用 | 不可恢复 | |
重装操作系统 | 节点组件被删除 | 节点移出再加入集群 | |
自行升级节点组件版本 | 可能导致节点无法使用 | 回退到原始版本 | |
删除或格式化节点 /etc/kubernetes 等核心目录数据 | 该 worker节点不可用 | 不可恢复 | |
更改节点 IP | 节点不可用 | 节点移出再加入集群 | |
自行修改核心组件(etcd、kube-apiserver、docker 等)参数 | 可能导致节点不可用 | 按照官网推荐配置参数 | |
修改操作系统配置 | 可能导致节点不可用 | 尝试还原配置项或删除节点重新购买 | |
其他 | 在 IAM中执行权限变更或修改的操作 | 集群部分资源如负载均衡可能无法创建成功 | 恢复权限 |
其他需谨慎操作的节点本地目录与文件:
/etc/kubernetes, /etc/docker, /opt/appagent, /usr/bin, /usr/local/bin, /usr/libexec, /lib/systemd, /opt/cni/bin, /data/kubelet目录下容器运行时, kubernetes, appctl, cni插件相关文件
/etc/yum.repos.d, /etc/apt/sources.list.d目录下yum源和apt源相关文件
高危操作 | 导致后果 | 误操作解决方案 |
修改内核网络相关参数(如 net.ipv4.ip_forward等) | 网络不通 | 回退所做修改 |
控制台删除或者修改主机路由 | 网络不通 | 回滚所作修改 |
修改节点上的iptables/ipvs规则 | 网络不通 | 回滚所做修改 |
修改节点的域名解析配置 | 网络不通 | 回滚所做修改 |
删除集群kube-system命名空间下的configmap | 负载均衡控制器功能异常 | 提交工单 |
通过LB控制台修改KCE创建的LB监听器 | 所做修改被 KCE 侧重置 | 通过 service/ingress yaml 来统一维护网络资源配置 |
通过LB控制台修改KCE创建的LB后端服务器 | ||
通过LB控制台修改KCE创建的LB证书 | ||
通过EIP控制台修改KCE创建的EIP配置 |
高危操作 | 导致后果 | 误操作解决方案 |
删除宿主机 /var/log/klog 目录 | 日志重复采集 | 不可恢复 |
删除宿主机 /var/log/pods 目录 | 日志丢失 | 不可恢复 |
高危操作 | 导致后果 | 误操作解决方案 |
控制台手动解挂EBS | Pod 写入报 io error | 删掉 node上mount 目录,重新调度 Pod |
节点上 umount 磁盘挂载路径 | Pod 写入本地磁盘 | 重新 mount 对应目录到 Pod 中 |
节点上直接操作EBS块设备 | Pod 写入本地磁盘 | 不可恢复 |
纯净模式