金山云-文档中心-集群支持GPU调度

容器服务(KCE)

查看更多结果

未找到含当前关键字的文档标题

页面目录

全部展开全部收起

产品更新动态

未找到含该关键词的产品

文档中心

容器服务(KCE)

容器服务用户指南

集群管理

容器集群支持GPU调度

最近更新时间：2021-03-03 10:31:46

若您的业务有运行机器学习、图像处理的等高运算密度的场景，您可以通过金山云容器集群+GPU快速开始使用GPU容器，无需手动安装nvidia driver和CUDA。

容器服务控制台操作说明

登录容器服务控制台。
在左侧导航栏中，选择集群，进入集群管理页面。
点击新建集群，进入创建集群页面。
在节点配置流程中，在选择云服务器机型时选择对应GPU机型，点击确认。

kubectl命令操作说明

不同于CPU和内存，您需要在yaml文件中显式申明你打算使用的GPU的数量，通过在container的resources.limits中设置nvidia.com/gpu，申明你想要使用的GPU数量。

示例：

apiVersion: v1
kind: Pod
metadata:
  name: cuda-vector-add
spec:
  restartPolicy: OnFailure
  containers:
    - name: cuda-vector-add
      image: hub.kce.ksyun.com/ksyun/cuda-vector-add:0.1
      resources:
        limits:
          nvidia.com/gpu: 1   # 指定调用nvida gpu的数量

使用限制

仅在创建时间为2018年12年27日之后的集群支持GPU调度，若您的集群创建时间早于上述时间且需要使用GPU容器，请提交工单申请。
GPU资源申请仅需要在容器资源的 limits 中配置。
容器之间不支持共享GPU，每个容器可以申请一个或者多个GPU。
GPU必须以整数为单位被申请使用。

文档导读

上一篇：容器服务推荐安全组设置

下一篇：集群资源预留

纯净模式常规模式

纯净模式

点击可全屏预览文档内容