全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

支持的GPU云服务器类型

最近更新时间:2024-01-10 10:17:12

GPU云服务器提供GPU加速的弹性计算服务,可以用于科学计算,AI深度学习,图形图像渲染与基于GPU的音视频编解码等诸多应用场景。容器实例已支持GPU云服务器,您可以指定容器实例底层所使用的GPU云服务器套餐规格来创建实例。

容器实例提供的GPU云服务器类型包括:

GPU云服务器

实例类型

适用场景

直通 (Passthrough)

GPU推理II型GN6I
GPU通用计算型P4V

深度学习、语音、图形/图像学习等常见训练和推理场景

注:

  1. 若要在容器实例中使用GPU云服务器,必须在Pod metadata中添加Annotation来指定GPU机型,目前不支持根据容器实例的GPU Limit值自动匹配GPU机型。指定GPU机型后,在Container配置中需添加nvidia.com/gpu字段声明GPU资源。

  2. 通过Deployment等控制器创建的Pod,如果Pod申请的GPU数量超过机型的GPU数量,会出现Pod在创建失败后不断重复创建的情况。为避免此情况发生,请确保Pod在nvidia.com/gpu字段中声明的GPU数量不超过Annotation中指定机型的GPU数量。

示例如下:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
      annotations:
        k8s.ksyun.com/kci-instance-type: P3I.8A1 # 根据需要指定GPU机型
        k8s.ksyun.com/kci-base-system-disk-size: "50" # vGPU类型的云服务器由于机型限制,需指定系统盘规格为50G或以上
    spec:
      containers:
      - name: nginx
        image: nginx:latest
        resources:
          limits:
            nvidia.com/gpu: 1 # 指定GPU卡数
        ports:
        - containerPort: 80
      nodeName: rbkci-virtual-kubelet # 指定nodeName将Pod调度到虚拟节点上

GPU推理II型GN6I

该实例适用于推理场景,以及简单的训练场景。

基于NVIDIA Tesla T4,每GPU具备16GB GDDR6显存、8.1TFLOPS的单精度 (FP32) 计算能力和130 TOPS的INT8计算能力。

实例特点包括:

  • 处理器:2.6 GHz主频的Intel® Xeon® Gold 6240 Processor

  • 支持系统盘类型:EBS3.0

  • 支持数据盘类型:EBS3.0

GN6I实例包括的型号和参数规格如下表所示:

型号

GPU(Tesla T4)

GPU显存(GDDR6)

vCPU(核)

内存(GiB)

网络收发包能力(万PPS)

网络带宽能力(Gbit/s)

多队列

GN6I.4A1

1颗

16GB*1

4

16

50

4

2

GN6I.8A1

1颗

16GB*1

8

32

80

5

2

GN6I.16A1

1颗

16GB*1

16

64

120

6

4

GN6I.16B2

2颗

16GB*2

16

64

120

6

4

GN6I.32B2

2颗

16GB*2

32

128

240

8

8

GN6I.32C4

4颗

16GB*4

32

128

240

8

8

GPU通用计算型P4V

该实例适用于深度学习的训练场景和推理场景。

基于NVIDIA Tesla V100,每GPU具备16GB HBM2 GPU内存、15TFLOPS的单精度 (FP32) 计算能力和125TFLOPS的混合精度计算能力。

实例特点包括:

  • 处理器:2.6 GHz主频的Intel® Xeon® Processor E5-2690 v4

  • 支持系统盘类型:本地SSD

  • 支持数据盘类型:本地SSD、EBS3.0

P4V实例包括的型号和参数规格如下表所示:

型号

GPU(Tesla V100)

GPU显存(HBM2)

vCPU(核)

内存(DDR4)

数据盘(本地SSD)

网络收发包能力(万PPS)

网络带宽能力(Gbit/s)

P4V.8A1

1颗

16GB*1

8

32GB

240GB

20

1.5

P4V.16B2

2颗

16GB*2

16

64GB

480GB

30

3

P4V.28C4

4颗

16GB*4

28

128GB

960GB

30

6

P4V.56D8

8颗

16GB*8

56

256GB

1920GB

40

8

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈