全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

部署服务

最近更新时间:2025-04-09 20:16:04

前提条件

开通权限:客户需先注册好金山云的账号并完成企业认证,后联系商务/售前开通文件共享服务的权限,过程可参考边缘节点计算产品权限开通文档。

资源配额:开通权限的同时请一并告知商务/售前您的资源需求,包括CPU、GPU、内存。

操作步骤

1.前往模型在线服务控制台

2.点击左侧菜单【服务】进入服务列表

3.点击左上角【部署服务】进入创建页面,依次按需选择或录入资源部署信息、模型服务信息、实例数量等配置信息。

各个配置项的详细说明,请见下表:

分类

配置项

说明

资源配置信息

资源组类型

可选公共资源组和专属资源组。

公共资源面向所有客户均可使用,暂只支持按量付费。专属资源组面向大型企业,提供独享资源,专属资源组暂只支持包年包月。

地域

目前暂只支持厦门电信41节点

算力类型

可选CPU类型和GPU类型

算了规格

针对CPU类型和GPU类型提供了丰富的算力规格供客户使用。客户可根据自身业务需要选择目标实例规格。

“告罄”字样代表该实例规格已经售罄或者当前登录客户配额不足。

模型服务信息

服务名称

服务的唯一标识。服务域名会根据服务域名生成。

命名规范:

  • 字母开头

  • 命名长度为 3~63 个字符

  • 只允许小写字母、数字、中横线(-),且不能以中横线开头或结尾

  • 服务名称全局唯一

镜像

可选公共镜像和自定义镜像。

公共镜像由官网维护,自定义镜像由用户维护。

针对公共镜像,如果没有您想要的,可以前往聆听反馈提建议,建议提交页面,产品选择“模型在线服务MOS”或“边缘节点计算”,我们相关产品经理再收到您的反馈后,会第一时间进行处理和反馈。

模型配置

模型配置最多可设置3组。每组信息均有NFS(文件共享服务实例)、NFS源路径(模型及数据所在文件共享服务实例的路径)、挂载路径(容器的目标挂载路径)组成。

NFS选择已创建好的文件共享服务。

文件共享服务需满足同节点和经典网络的要求。

NFS源路径,可以手动录入模型或数据所在文件共享服务的路径,也可以直接选择已经成功导入的模型路径(会根据导入历史自动提示)

挂载路径,输入容器的目标挂载路径。目前挂载方式均为读写的形式进行挂载。

运行命令

镜像内服务的启动命令,例如:python ./run.py

端口号

镜像启动后监听的本地HTTP端口,范围为1~65535。默认为8000端口。

外部端口无需设置,均为80/443。

环境变量

配置镜像内服务启动所依赖的环境变量。键值对,最多支持设置20对。

实例数量

实例数量

可选范围为1~20。

如需更多实例数量请提交工单告诉我们(产品选择边缘节点计算即可)。

4.配置完成后,点击【部署】按钮完成新建。一般1~2分钟即可部署完成,如果镜像较大可能会等待时间较长。

纯净模式常规模式

纯净模式

点击可全屏预览文档内容