全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

托管集群迁移至KCE2.0

最近更新时间:2026-06-08 19:32:45

容器服务2.0作为新一代云原生容器平台,在架构、性能与功能丰富度上实现了全面升级,为企业提供了更高效、更稳定、更具扩展性的容器化解决方案。

您可以将KCE1.0托管集群热迁移至KCE2.0。热迁移无需中断业务,不影响集群业务正常运行,集群迁移成功后不支持回退。

前提条件

  • 已有KCE1.0托管集群(待迁移集群),且k8s版本为1.27及以上。

    迁移后,集群版本保持不变。

  • 迁移至KCE2.0功能以白名单形式开放,如有相关需求,请提交工单或联系商务申请。

注意事项

注意项

说明

集群操作

迁移过程中,禁止对集群执行任何操作,建议选择业务低峰期发起迁移。

计费说明

kce2.0目前处于公测阶段,控制面apiserver内存费用、etcd副本费用将归零处理,用户仅需为底层资源(如云服务器、弹性IP等)付费。

公网访问

由于底层架构升级,开启公网访问的1.0托管集群迁移至kce2.0需重新配置SLB、EIP,通过EIP暴露 API Server实现公网访问,迁移至2.0后,公网访问入口及config文件将发生变化,请及时更新公网入口及config文件。

操作步骤

步骤一:执行迁移

迁移集群的流程包括前置检查、迁移确认、执行迁移三个部分。集群迁移前置检查通过并完成迁移配置确认后,KCE1.0集群才会被执行迁移至KCE2.0。

  1. 登录容器服务控制台,左侧导航栏选择集群

  2. 集群列表页,找到需要迁移的托管集群,在列表右侧的操作列下,单击更多>迁移至KCE2.0

  3. 在迁移前置检查页,当所有检查项均处于通过状态时,单击下一步

  4. 迁移确认页,阅读顶部注意事项,完成集群安全组等配置,单击确认,执行迁移。

前置检查说明

检查项

说明

集群节点状态

集群节点的容器Agent状态异常将导致集群迁移操作无法正常执行,需完成以下任意操作后,再尝试迁移:

  • 修复对应节点Agent,确保其状态恢复正常

  • 将处于异常状态的节点从集群中移出

节点池弹性伸缩

迁移过程中,节点动态增减将影响迁移操作正常执行,请先该关闭节点池的弹性伸缩功能,再执行迁移操作,关闭节点池弹性伸缩参见节点池管理

  • 迁移完成后,弹性伸缩组中的节点将被自动移出,弹性伸缩规则将不再生效,用户可自行选择是否删除伸缩组

  • 迁移完成后,如需继续使用节点池弹性伸缩能力,请在 KCE 2.0 节点池中重新配置扩缩容策略

vpc-cni版本

仅当集群开启vpc-cni模式时显示该检查项,检查vpc-cni版本是否支持迁移。

  • 版本 1.5.10 ≤ 当前版本 < 1.5.15 时,需升级至最新版,升级vpc-cni操作说明参见vpc-cni模式说明

  • 低于 1.5.10 的版本暂不支持升级,无法进行迁移

csi组件

仅当集群已安装CSI组件时显示检查项,检查集群是否仍在使用旧版 csi-driver 组件,若仍在使用,请执行以下操作:

  • 前往组件管理页卸载 csi-driver,并根据实际存储场景按需安装 ebs-csiks3-csikfs-csi ,卸载与安装组件操作说明参见组件管理

  • 若业务使用了ks3-csi:重新安装组件后,必须重启所有挂载ks3存储卷的Pod,否则可能导致挂载失败或读写异常

托管Prometheus(MSP)扩展监控

仅当集群关联托管Prometheus实例并开启dcgm扩展监控时显示该检查项,检查msp-dcgm-exporter 扩展监控组件的版本是否满足迁移要求,当检查项不通过时,请执行以下操作:

  • 前往托管Prometheus控制台,重启(关闭再打开)对应 MSP 实例的dcgm扩展监控功能,系统将自动更新组件版本,扩展监控操作说明参见pod级别GPU监控

控制面参数一致性

为保障控制面组件在迁移过程中正常运行,需保证同一控制面组件的所有副本参数配置一致。

若校验不通过,单击下拉按钮展开列表,查看不一致的参数项,提交工单联系容器团队修改控制面组件参数。

迁移配置项说明

配置项

说明

安全组

KCE2.0为确保集群内部对服务访问流量的转发通畅,要求同一个集群下的主机节点绑定相同的安全组。

后续新增节点将默认绑定该安全组,建议选择当前存量节点的公共安全组。

API Server公网访问

由于底层架构升级,开启公网访问的1.0托管集群迁移至kce2.0需重新配置SLB、EIP,迁移至2.0后,公网访问入口及config文件将发生变化,请及时更新公网入口及config文件。

配置项说明如下:

  • SLB实例:自动创建一个名为kce-slb-public-<集群id><随机8位字符>的公网SLB,该实例计费方式为一次性后付费。

  • 绑定EIP:选择未被绑定的EIP实例。

    多集群同时迁移时注意不要选择同一个EIP实例,选择同一个EIP实例将导致迁移失败。

步骤二:查看迁移结果

  1. 在集群列表页,单击迁移详情迁移记录,可以实时关注迁移进度,若出现迁移超时或遇到其他问题,可提交工单联系容器服务团队处理。

  2. 在kce1.0控制台,当迁移进度为100%,集群状态为已迁移时,表示集群已成功迁移至KCE2.0,后续使用、管理该容器集群请前往KCE2.0控制台

(可选)步骤三:组件处理

集群迁移至 KCE 2.0 后,原有组件将以“迁移”标识展示在组件管理页,这些组件可继续正常运行,不影响现有业务使用。

用户可根据需要选择是否卸载迁移组件并安装对应的 KCE 2.0 原生组件(不带“迁移”标识)。安装 KCE 2.0 原生组件后,可获得后续版本升级、参数配置等组件管理能力。

常见问题

迁移过程中托管集群的业务是否会受影响?

集群迁移过程中数据面节点不变,渐进式切换控制面,正常情况下,不会对正在运行的业务产生影响。

迁移流程大概需要多长时间?

集群迁移整体耗时20~40分钟,如若出现迁移超时,请提交工单联系容器服务团队处理。

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈