集群弹性伸缩

最近更新时间:2019-08-07 18:04:59

Cluster AutoScaler (简称CA)是一个自动扩展和收缩 Kubernetes 集群 Node 的扩展。当集群容量不足时,它会自动去 Cloud Provider 创建新的 Node,而在 Node 长时间(超过 10 分钟)资源利用率很低时(低于 50%)自动将其删除以节省开支。

开启弹性伸缩

1、点击集群名称,进入集群详情页面,切换至【伸缩组】菜单,进入集群伸缩组页面

image.png

2、点击【新建伸缩组】,进入创建伸缩的流程

image.png

伸缩组名称:用户自定义伸缩组名称,伸缩组名称在地域范围内唯一

启动配置:选择集群中已存在的一个节点作为伸缩组的启动配置,伸缩组的启动配置将继承已选择节点的如下配置:

  • 机型
  • vCPU
  • 内存
  • 系统盘大小
  • 数据盘大小
  • 磁盘类型
  • 安全组
  • 私有网络
  • 子网

登录方式:伸缩组内云服务器的登录方式

节点数量范围:伸缩组内云服务器的数量范围

label:为伸缩组设置 Label,会在自动扩容出的节点上设置 Label,从而实现服务的灵活调度策略

3、点击【确认】,完成伸缩组的创建。

备注 当前功能仅支持本地盘机型,我们将在下个版本支持云盘机型的弹性伸缩

扩容条件

Cluster AutoScaler 定期(默认间隔 10s)检测是否有充足的资源来调度新创建的 Pod,当资源不足时会调用 Cloud Provider 创建新的 Node。 每当kubernetes调度程序找不到一个运行pod的地方时,它会将pod的PodCondition设置为false,并将原因设置为“unschedulable ”。集群自动扩缩容程序正是每隔一段时间扫描一次是否有不可调度的pod来进行扩容的,如果有就尝试扩容节点来运行这些pod

扩容策略

当集群中有多个 Node Group 时,可以通过选项配置选择 Node Group 的策略,支持如下四种方式

  • random:随机选择伸缩组进行扩容
  • most-pods:选择容量最大(能调度更多pod)的伸缩组进行扩容
  • least-waste:以最小浪费原则选择,选择调度pod后可用资源剩余更少的伸缩组进行扩容

缩容条件

Cluster AutoScaler 也会定期(默认间隔 10s)自动监测 Node 的资源使用情况,当一个 Node 长时间(超过 10 分钟其期间没有执行任何扩展操作)资源利用率都很低时(默认值低于 50%)并且这个node上的pod可以被调度到别的节点上,那么CA自动将其从集群中删除。此时,原来的 Pod 会自动调度到其他 Node 上面

当 Node 上面的 Pods 满足下面的条件之一时,Node 不会删除:

  • Pod 配置了 PodDisruptionBudget (PDB),当Pod不满足PDB时,不会缩容

  • Node 上运行了 kube-system命名空间下的pod

  • Pod 不是通过 deployment, replica set, job, stateful set 等控制器创建的

  • Pod 使用了本地存储

  • 其他原因导致的 Pod 无法重新调度,如资源不足,其他 Node 无法满足 NodeSelector 或 Affinity 等

注意事项

  • Cluster AutoScaler 与基于监控指标的弹性伸缩的节点扩缩容(Auto Scaling,简称AS)相冲突,请不要为容器集群的伸缩组设置基于监控指标的自动扩缩
  • 请指定 Pod 的 request 值:自动扩容的触发条件是集群中存在由于资源不足而无法调度的 Pod,而判断资源是否充足正是基于 Pod 的 request 来进行的
  • 不要直接修改属于伸缩组内的节点,确保伸缩组中的节点具有相同的配置
  • 删除伸缩组会同时删除伸缩组内的服务器,请谨慎操作
  • 在集群进行缩容的过程中,服务可能会遇到一些中断。例如,如果服务包含具有单个副本的控制器,则在删除该副本的 Pod 的当前节点时,此 Pod 可能会在其他节点上重启。在启用自动缩容之前,请确保服务可以容忍潜在的中断。建议您使用PodDisruptionBudgets 阻止 Pod 在缩容时被删除

金山云,开启您的云计算之旅

注册有礼