最近更新时间:2026-04-29 10:47:27
本文给出了不同规格内置大模型的资源规格配置建议,用户在部署内置大模型时可参考以下规格建议进行实例资源配置。
模型分类 | 模型 | CPU(核) | 内存(Gi) | GPU(卡) | 是否支持多机部署 | 是否支持单点部署 |
deepseek | DeepSeek-R1-Distill-Qwen-1.5B | 6 | 24 | 1 | 否 | 是 |
DeepSeek-R1-Distill-Qwen-7B | 8 | 24 | 1 | 否 | 是 | |
DeepSeek-R1-Distill-Qwen-14B | 24 | 96 | 1 | 否 | 是 | |
DeepSeek-R1-Distill-Qwen-32B | 32 | 160 | 2 | 否 | 是 | |
DeepSeek-R1-Distill-Llama-8B | 24 | 64 | 1 | 是 | 是 | |
DeepSeek-R1-Distill-Llama-70B | 48 | 192 | 4 | 是 | 是 | |
DeepSeek-R1 | 72 | 512 | 8 | 是 | 否 | |
DeepSeek-V3 | 72 | 512 | 8 | 是 | 否 | |
DeepSeek-V3-0324 | 72 | 512 | 8 | 是 | 否 | |
DeepSeek-V3.1 | 72 | 512 | 8 | 是 | 否 | |
Baichuan | Baichuan-M2-32B | 32 | 160 | 2 | 否 | 是 |
GLM | GLM-4-9B-0414 | 24 | 64 | 1 | 是 | 是 |
GLM-4-32B-0414 | 32 | 160 | 2 | 是 | 是 | |
GLM-4-32B-Base-0414 | 32 | 160 | 2 | 是 | 是 | |
GLM-Z1-9B-0414 | 24 | 64 | 1 | 是 | 是 | |
GLM-Z1-32B-0414 | 32 | 160 | 2 | 是 | 是 | |
GLM-Z1-Rumination-32B-0414 | 32 | 160 | 2 | 是 | 是 | |
Kimi | Kimi-K2-Base | 72 | 512 | 8 | 是 | 否 |
Kimi-K2-Instruct | 72 | 512 | 8 | 是 | 否 | |
Qwen | Qwen2.5-VL-7B-Instruct | 16 | 48 | 1 | 否 | 是 |
Qwen2.5-VL-32B-Instruct | 48 | 160 | 2 | 否 | 是 | |
Qwen3-30B-A3B | 32 | 160 | 2 | 是 | 是 | |
Qwen3-32B | 32 | 160 | 2 | 是 | 是 | |
Qwen3-235B-A22B | 48 | 256 | 4 | 是 | 是 | |
MiMo | MiMo-7B-RL | 24 | 64 | 1 | 是 | 是 |
MiMo-7B-RL-Zero | 24 | 64 | 1 | 是 | 是 | |
Cosmos | cosmos-Reason1-7B | 8 | 24 | 1 | 否 | 是 |
纯净模式
