最近更新时间:2025-11-20 19:39:06
GPU云服务器提供GPU加速的弹性计算服务,可以用于科学计算,AI深度学习,图形图像渲染与基于GPU的音视频编解码等诸多应用场景。容器实例已支持GPU云服务器,您可以指定容器实例底层所使用的GPU云服务器套餐规格来创建实例。
容器实例提供的GPU云服务器类型包括:
GPU云服务器 | 实例类型 | 适用场景 |
|---|---|---|
直通 (Passthrough) | 深度学习、语音、图形/图像学习等常见训练和推理场景 |
注:
若要在容器实例中使用GPU云服务器,必须在Pod metadata中添加Annotation来指定GPU机型,目前不支持根据容器实例的GPU Limit值自动匹配GPU机型。指定GPU机型后,在Container配置中需添加
nvidia.com/gpu字段声明GPU资源。通过Deployment等控制器创建的Pod,如果Pod申请的GPU数量超过机型的GPU数量,会出现Pod在创建失败后不断重复创建的情况。为避免此情况发生,请确保Pod在
nvidia.com/gpu字段中声明的GPU数量不超过Annotation中指定机型的GPU数量。
示例如下:
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-rbkci-gpu-online
namespace: default
labels:
app: nginx
spec:
replicas: 1
selector:
matchLabels:
app: nginx
template:
metadata:
annotations:
k8s.ksyun.com/kci-instance-type: "P4V.8A1" # 根据需要指定GPU机型
labels:
app: nginx
spec:
affinity:
nodeAffinity:
requiredDuringSchedulingIgnoredDuringExecution:
nodeSelectorTerms:
- matchExpressions:
- key: type
operator: In
values:
- virtual-kubelet
containers:
- name: nginx
image: nginx:latest
resources:
limits:
nvidia.com/gpu: 1 # 指定GPU卡数
tolerations:
- key: rbkci-virtual-kubelet.io/provider
value: kingsoftcloud
effect: NoSchedule该实例适用于深度学习的训练场景和推理场景。
基于NVIDIA Tesla V100,每GPU具备16GB HBM2 GPU内存、15TFLOPS的单精度 (FP32) 计算能力和125TFLOPS的混合精度计算能力。
实例特点包括:
处理器:2.6 GHz主频的Intel® Xeon® Processor E5-2690 v4
支持系统盘类型:本地SSD
支持数据盘类型:本地SSD、EBS3.0
P4V实例包括的型号和参数规格如下表所示:
型号 | GPU(Tesla V100) | GPU显存(HBM2) | vCPU(核) | 内存(DDR4) | 数据盘(本地SSD) | 网络收发包能力(万PPS) | 网络带宽能力(Gbit/s) |
|---|---|---|---|---|---|---|---|
P4V.8A1 | 1颗 | 16GB*1 | 8 | 32GB | 240GB | 20 | 1.5 |
P4V.16B2 | 2颗 | 16GB*2 | 16 | 64GB | 480GB | 30 | 3 |
P4V.28C4 | 4颗 | 16GB*4 | 28 | 128GB | 960GB | 30 | 6 |
P4V.56D8 | 8颗 | 16GB*8 | 56 | 256GB | 1920GB | 40 | 8 |
计算:
处理器:2.6 GHz主频的Intel® Xeon® Platinum 8358P
基于高性能NVIDIA GPU(GM302),单块GPU显存高达80GB、19.5TFLOPS的单精度 (FP32) 计算能力。
存储:
支持系统盘类型:ESSD
支持数据盘类型:ESSD
使用场景:
该实例适用于深度学习的训练场景和推理场景。
P6V实例包括的型号和参数规格如下表所示:
型号 | GPU (GM302) | GPU显存 (HBM2) | vCPU (核) | 内存 (DDR4) | 网络收发包能力 (万PPS) | 网络带宽能力 (Gbit/s) |
|---|---|---|---|---|---|---|
P6V.16D1 | 1颗 | 80GB*1 | 16 | 128GB | 60 | 3 |
P6V.32D2 | 2颗 | 80GB*2 | 32 | 256GB | 120 | 6 |
P6V.64D4 | 4颗 | 80GB*4 | 64 | 512GB | 250 | 12 |
P6V.112D8 | 8颗 | 80GB*8 | 112 | 896GB | 500 | 24 |
计算:
处理器:2.6 GHz主频的Intel® Xeon® Gold 6240 Processor
基于NVIDIA Tesla T4,每GPU具备16GB GDDR6显存、8.1TFLOPS的单精度 (FP32) 计算能力和130 TOPS的INT8计算能力。
存储:
支持系统盘类型:EBS3.0
支持数据盘类型:EBS3.0
使用场景:
该实例适用于推理场景,以及简单的训练场景。
GN6I实例包括的型号和参数规格如下表所示:
型号 | GPU | GPU显存 (GDDR6) | vCPU (核) | 内存 (GiB) | 网络收发包能力 (万PPS) | 网络带宽能力 (Gbit/s) | 多队列 |
|---|---|---|---|---|---|---|---|
GN6I.4A1 | T4*1 | 16GB*1 | 4 | 16 | 50 | 4 | 2 |
GN6I.8A1 | T4*1 | 16GB*1 | 8 | 32 | 80 | 5 | 2 |
GN6I.16A1 | T4*1 | 16GB*1 | 16 | 64 | 120 | 6 | 4 |
GN6I.16B2 | T4*2 | 16GB*2 | 16 | 64 | 120 | 6 | 4 |
GN6I.32B2 | T4*2 | 16GB*2 | 32 | 128 | 240 | 8 | 8 |
GN6I.32C4 | T4*4 | 16GB*4 | 32 | 128 | 240 | 8 | 8 |
计算:
处理器:2.6 GHz主频的Intel Xeon Platinum 8358P
基于NVIDIA A10,每GPU具备24GB GDDR6显存、31.2TFLOPS的单精度 (FP32) 计算能力和250 TOPS的INT8计算能力。
存储:
支持系统盘类型:SSD3.0和高效云盘EHDD
支持数据盘类型:SSD3.0和高效云盘EHDD
使用场景:
该实例适用于推理场景,以及简单的训练场景。
GN7I实例包括的型号和参数规格如下表所示:
型号 | GPU | GPU显存 (GDDR6) | vCPU (核) | 内存 (GiB) | 网络收发包能力 (万PPS) | 网络带宽能力 (Gbit/s) | 多队列 |
|---|---|---|---|---|---|---|---|
GN7I.16C1 | A10*1 | 24GB*1 | 16 | 64 | 150 | 6 | 16 |
GN7I.16D1 | A10*1 | 24GB*1 | 16 | 96 | 150 | 6 | 16 |
GN7I.32D1 | A10*1 | 24GB*1 | 32 | 192 | 300 | 12 | 16 |
GN7I.64D2 | A10*2 | 24GB*2 | 64 | 384 | 500 | 20 | 16 |
GN7I.112D4 | A10*4 | 24GB*4 | 112 | 719 | 500 | 20 | 16 |
计算:
处理器:2.6 GHz主频的Intel Xeon Icelake处理器
基于高性能NVIDIA GPU(GDP401) ,每GPU具备24GB显存、82.6TFLOPS的单精度 (FP32) 计算能力。
存储:
支持系统盘类型:ESSD
支持数据盘类型:ESSD
使用场景:
该实例适用于推理场景,以及简单的训练场景。
GN8I实例包括的型号和参数规格如下表所示:
型号 | GPU | GPU显存 (GDDR6) | vCPU (核) | 内存 (GiB) | 网络收发包能力 (万PPS) | 网络带宽能力 (Gbit/s) | 多队列 |
|---|---|---|---|---|---|---|---|
GN8I.14C1 | GDP401*1 | 24GB*1 | 14 | 56 | 120 | 5 | 8 |
GN8I.28C2 | GDP401*2 | 24GB*2 | 28 | 112 | 250 | 10 | 16 |
GN8I.56C4 | GDP401*4 | 24GB*4 | 56 | 224 | 250 | 10 | 16 |
GN8I.112C8 | GDP401*8 | 24GB*8 | 112 | 448 | 500 | 25 | 16 |
纯净模式
