全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

创建模型在线服务

最近更新时间:2025-09-05 15:38:41

前提条件

  1. 已创建1个及以上的通用资源池

  2. 资源池中已经创建1个及以上的队列

在线服务创建流程

  1. 登录金山云星流训推平台控制台

  2. 在左侧导航栏,选择模型在线服务

  3. 点击新建,进入创建在线服务流程

  4. 根据以下提示进行在线服务配置,配置完成后点击下一步

    • 基本信息

      • 服务名称:必填,用户自定义在线服务的名称,1-64个字符,允许字母 中文 数字 -_、/(),需以字母开头

      • 描述:选填,200个字符以内

    • 环境配置

      • 部署类型:支持模型部署和自定义部署,用户根据需求选择要部署的模型,当前支持的模型见下方列表

      • 启动参数:输入启动命令,用于启动模型在线服务

      • 代码配置:输入代码路径,指定模型服务所用的代码位置

      • 环境变量:输入环境变量,用于配置模型在线服务的环境参数

      • 端口:输入服务的端口号

  • 资源配置

    • 资源池:选择在线服务所需资源所属资源池

    • 队列:用户可自定义选择具备权限的队列

    • 资源类型:当前支持GPU类型资源部署在线服务

      • GPU卡型:选择队列内已配置的GPU卡型

      • GPU数量:当前GPU数量不可配置

      • CPU核数:用户根据需求和模型大小配置CPU核数

      • 内存:用户根据需求和模型大小配置内存

      • 副本数量:根据需求配置模型在线服务的副本数量

      • 多机部署:根据模型大小选择是否开启多机部署,开启后需配置机器数量

  • 网络配置

    • 子网:选择资源池所在VPC下的子网

  • 权限配置

    • 默认仅创建者可见,开启队列内公开可见后全队列可见 。

内置大模型列表

DeepSeek-R1 Distill Qwen-1.5B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Llama-70B

DeepSeek-R1

DeepSeek-V3

GLM-4-9B-0414

GLM-Z1-32B-0414

GLM-4-32B-Base-0414

GLM-4-32B-0414

GLM-Z1-32B-0414

GLM-Z1-Rumination-32B-0414

Baichuan-M2-32B

Kimi-K2-Base

Kimi-K2-Instruct

Qwen2.5-VL-32B-Instruct

Qwen2.5-VL-7B-Instruct

Qwen3-235B-A22B

Qwen3-30B-A3B

Qwen3-32B

MiMo-7B-RL

MiMo-7B-RL-Zero

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈