集群弹性伸缩

最近更新时间:2021-09-24 16:57:59

查看PDF

Cluster AutoScaler (简称CA)是一个自动扩展和收缩 Kubernetes 集群 Node 的扩展。当集群容量不足时,它会自动去 Cloud Provider 创建新的 Node,而在 Node 长时间(超过 10 分钟)资源利用率很低时(低于 50%)自动将其删除以节省开支。

扩容条件

Cluster AutoScaler 定期(默认间隔 10s)检测是否有充足的资源来调度新创建的 Pod,当资源不足时会调用 Cloud Provider 创建新的 Node。
每当kubernetes调度程序找不到一个运行pod的地方时,它会将pod的PodCondition设置为false,并将原因设置为“unschedulable ”。集群自动扩缩容程序正是每隔一段时间扫描一次是否有不可调度的pod来进行扩容的,如果有就尝试扩容节点来运行这些pod。

扩容策略

当集群中有多个节点池时,可以通过选项配置选择节点池的策略,支持如下三种方式:

  • random:随机选择节点池进行扩容。
  • most-pods:选择容量最大(能调度更多pod)的节点池进行扩容。
  • least-waste:以最小浪费原则选择,选择调度pod后可用资源剩余更少的节点池进行扩容。

缩容条件

Cluster AutoScaler 也会定期(默认间隔 10s)自动监测 Node 的资源使用情况,当一个 Node 长时间(超过 10 分钟其期间没有执行任何扩展操作)资源利用率都很低时(默认值低于 50%)并且这个node上的pod可以被调度到别的节点上,那么CA自动将其从集群中删除。此时,原来的 Pod 会自动调度到其他 Node 上面。

当 Node 上面的 Pods 满足下面的条件之一时,Node 不会缩容:

  • Pod 配置了 PodDisruptionBudget (PDB),当Pod不满足PDB时,不会缩容。

  • Node 上运行了 kube-system命名空间下非 DaemonSet 管理的 的pod。

  • Pod 不是通过 deployment, replicaset, job, statefulset 等控制器创建的。

  • Pod 使用了本地存储。

  • 其他原因导致的 Pod 无法重新调度,如亲和、反亲和等,无法调度到其他节点。

注意事项

  • Cluster AutoScaler 与基于监控指标的弹性伸缩的节点扩缩容(Auto Scaling,简称AS)相冲突,请不要为容器集群的节点池设置基于监控指标的自动扩缩。
  • 请指定 Pod 的 request 值:自动扩容的触发条件是集群中存在由于资源不足而无法调度的 Pod,而判断资源是否充足正是基于 Pod 的 request 来进行的。
  • 不要直接修改属于弹性伸缩节点池内的节点,确保弹性伸缩节点池中的节点具有相同的配置。
  • 在集群进行缩容的过程中,服务可能会遇到一些中断。例如,如果服务包含具有单个副本的控制器,则在删除该副本的 Pod 的当前节点时,此 Pod 可能会在其他节点上重启。在启用自动缩容之前,请确保服务可以容忍潜在的中断。建议您使用PodDisruptionBudgets 阻止 Pod 在缩容时被删除。

文档内容是否对您有帮助?

根本没帮助
文档较差
文档一般
文档不错
文档很好

在文档使用中是否遇到以下问题

内容不全,不深入
内容更新不及时
描述不清晰,比较混乱
系统或功能太复杂,缺乏足够的引导
内容冗长

更多建议

0/200

评价建议不能为空

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

问题反馈