金山云-文档中心-支持的GPU云服务器类型

容器实例

查看更多结果

未找到含当前关键字的文档标题

页面目录

全部展开全部收起

产品更新动态

未找到含该关键词的产品

文档中心

容器实例

购买与计费

支持的GPU云服务器类型

最近更新时间：2024-01-10 10:17:12

GPU云服务器提供GPU加速的弹性计算服务，可以用于科学计算，AI深度学习，图形图像渲染与基于GPU的音视频编解码等诸多应用场景。容器实例已支持GPU云服务器，您可以指定容器实例底层所使用的GPU云服务器套餐规格来创建实例。

容器实例提供的GPU云服务器类型包括：

GPU云服务器	实例类型	适用场景
直通 (Passthrough)	GPU推理II型GN6I GPU通用计算型P4V	深度学习、语音、图形/图像学习等常见训练和推理场景

注：
若要在容器实例中使用GPU云服务器，必须在Pod metadata中添加Annotation来指定GPU机型，目前不支持根据容器实例的GPU Limit值自动匹配GPU机型。指定GPU机型后，在Container配置中需添加nvidia.com/gpu字段声明GPU资源。
通过Deployment等控制器创建的Pod，如果Pod申请的GPU数量超过机型的GPU数量，会出现Pod在创建失败后不断重复创建的情况。为避免此情况发生，请确保Pod在nvidia.com/gpu字段中声明的GPU数量不超过Annotation中指定机型的GPU数量。

示例如下：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
      annotations:
        k8s.ksyun.com/kci-instance-type: P3I.8A1 # 根据需要指定GPU机型
        k8s.ksyun.com/kci-base-system-disk-size: "50" # vGPU类型的云服务器由于机型限制，需指定系统盘规格为50G或以上
    spec:
      containers:
      - name: nginx
        image: nginx:latest
        resources:
          limits:
            nvidia.com/gpu: 1 # 指定GPU卡数
        ports:
        - containerPort: 80
      nodeName: rbkci-virtual-kubelet # 指定nodeName将Pod调度到虚拟节点上

GPU推理II型GN6I

该实例适用于推理场景，以及简单的训练场景。

基于NVIDIA Tesla T4，每GPU具备16GB GDDR6显存、8.1TFLOPS的单精度 (FP32) 计算能力和130 TOPS的INT8计算能力。

实例特点包括：

处理器：2.6 GHz主频的Intel® Xeon® Gold 6240 Processor
支持系统盘类型：EBS3.0
支持数据盘类型：EBS3.0

GN6I实例包括的型号和参数规格如下表所示：

型号	GPU(Tesla T4)	GPU显存(GDDR6)	vCPU(核)	内存(GiB)	网络收发包能力(万PPS)	网络带宽能力(Gbit/s)	多队列
GN6I.4A1	1颗	16GB*1	4	16	50	4	2
GN6I.8A1	1颗	16GB*1	8	32	80	5	2
GN6I.16A1	1颗	16GB*1	16	64	120	6	4
GN6I.16B2	2颗	16GB*2	16	64	120	6	4
GN6I.32B2	2颗	16GB*2	32	128	240	8	8
GN6I.32C4	4颗	16GB*4	32	128	240	8	8

GPU通用计算型P4V

该实例适用于深度学习的训练场景和推理场景。

基于NVIDIA Tesla V100，每GPU具备16GB HBM2 GPU内存、15TFLOPS的单精度 (FP32) 计算能力和125TFLOPS的混合精度计算能力。

实例特点包括：

处理器：2.6 GHz主频的Intel® Xeon® Processor E5-2690 v4
支持系统盘类型：本地SSD
支持数据盘类型：本地SSD、EBS3.0

P4V实例包括的型号和参数规格如下表所示：

型号	GPU(Tesla V100)	GPU显存(HBM2)	vCPU(核)	内存(DDR4)	数据盘(本地SSD)	网络收发包能力(万PPS)	网络带宽能力(Gbit/s)
P4V.8A1	1颗	16GB*1	8	32GB	240GB	20	1.5
P4V.16B2	2颗	16GB*2	16	64GB	480GB	30	3
P4V.28C4	4颗	16GB*4	28	128GB	960GB	30	6
P4V.56D8	8颗	16GB*8	56	256GB	1920GB	40	8

文档导读

上一篇：支持的云服务器类型

下一篇：竞价模式说明

纯净模式常规模式

纯净模式

点击可全屏预览文档内容

计算

办公云

游戏服务

开发者工具

应用中间件

其它

网络

大数据

应用服务

用户中心

数据库

云安全

合作与生态

合规性

存储与云分发

视频云服务

云监控

消息队列

人工智能

管理与审计

支持的GPU云服务器类型

GPU推理II型GN6I

GPU通用计算型P4V