全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

集群高危操作说明

最近更新时间:2024-06-06 19:58:47

集群运行过程中,您需注意避免如下高危操作,以下说明了高危操作可能导致的后果及误操作后解决方案。

集群

分类

高危操作

导致后果

误操作解决方案

master 及 etcd 节点

修改集群内节点安全组

可能导致 master 节点无法使用

按照官网推荐配置放通安全组

节点到期或被销毁

该 master 节点不可用

不可恢复

重装操作系统

master 组件被删除

不可恢复

自行升级 master 或者 etcd 组件版本

可能导致集群无法使用

回退到原始版本

删除或格式化节点 /etc/kubernetes 等核心目录数据

该 master 节点不可用

不可恢复

更改节点 IP

该 master 节点不可用

改回原 IP

自行修改核心组件(etcd、kube-apiserver、docker 等)参数

可能导致 master 节点不可用

回退至默认参数

自行更换 master 或 etcd 证书

可能导致集群不可用

不可恢复

worker 节点

修改集群内节点安全组

可能导致节点无法使用

按照官网推荐配置放通安全组

调整节点实例规格

机器强制关机,节点不可用

节点移出再加入集群

节点到期或被销毁

该节点不可用

不可恢复

重装操作系统

节点组件被删除

节点移出再加入集群

自行升级节点组件版本

可能导致节点无法使用

回退到原始版本

删除或格式化节点 /etc/kubernetes 等核心目录数据

该 worker节点不可用

不可恢复

更改节点 IP

节点不可用

节点移出再加入集群

自行修改核心组件(etcd、kube-apiserver、docker 等)参数

可能导致节点不可用

按照官网推荐配置参数

修改操作系统配置

可能导致节点不可用

尝试还原配置项或删除节点重新购买

其他

在 IAM中执行权限变更或修改的操作

集群部分资源如负载均衡可能无法创建成功

恢复权限

其他需谨慎操作的节点本地目录与文件:

  • /etc/kubernetes, /etc/docker, /opt/appagent, /usr/bin, /usr/local/bin, /usr/libexec, /lib/systemd, /opt/cni/bin, /data/kubelet目录下容器运行时, kubernetes, appctl, cni插件相关文件

  • /etc/yum.repos.d, /etc/apt/sources.list.d目录下yum源和apt源相关文件

网络与负载均衡

高危操作

导致后果

误操作解决方案

修改内核网络相关参数(如 net.ipv4.ip_forward等)

网络不通

回退所做修改

控制台删除或者修改主机路由

网络不通

回滚所作修改

修改节点上的iptables/ipvs规则

网络不通

回滚所做修改

修改节点的域名解析配置

网络不通

回滚所做修改

删除集群kube-system命名空间下的configmap

负载均衡控制器功能异常

提交工单

通过LB控制台修改KCE创建的LB监听器

所做修改被 KCE 侧重置

通过 service/ingress yaml 来统一维护网络资源配置

通过LB控制台修改KCE创建的LB后端服务器

通过LB控制台修改KCE创建的LB证书

通过EIP控制台修改KCE创建的EIP配置

日志

高危操作

导致后果

误操作解决方案

删除宿主机 /var/log/klog 目录

日志重复采集

不可恢复

删除宿主机 /var/log/pods 目录

日志丢失

不可恢复

云硬盘

高危操作

导致后果

误操作解决方案

控制台手动解挂EBS

Pod 写入报 io error

删掉 node上mount 目录,重新调度 Pod

节点上 umount 磁盘挂载路径

Pod 写入本地磁盘

重新 mount 对应目录到 Pod 中

节点上直接操作EBS块设备

Pod 写入本地磁盘

不可恢复

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈