最近更新时间:2025-04-09 20:16:04
开通权限:客户需先注册好金山云的账号并完成企业认证,后联系商务/售前开通文件共享服务的权限,过程可参考边缘节点计算产品权限开通文档。
资源配额:开通权限的同时请一并告知商务/售前您的资源需求,包括CPU、GPU、内存。
1.前往模型在线服务控制台
2.点击左侧菜单【服务】进入服务列表
3.点击左上角【部署服务】进入创建页面,依次按需选择或录入资源部署信息、模型服务信息、实例数量等配置信息。
各个配置项的详细说明,请见下表:
分类 | 配置项 | 说明 |
---|---|---|
资源配置信息 | 资源组类型 | 可选公共资源组和专属资源组。 公共资源面向所有客户均可使用,暂只支持按量付费。专属资源组面向大型企业,提供独享资源,专属资源组暂只支持包年包月。 |
地域 | 目前暂只支持厦门电信41节点 | |
算力类型 | 可选CPU类型和GPU类型 | |
算了规格 | 针对CPU类型和GPU类型提供了丰富的算力规格供客户使用。客户可根据自身业务需要选择目标实例规格。 “告罄”字样代表该实例规格已经售罄或者当前登录客户配额不足。 | |
模型服务信息 | 服务名称 | 服务的唯一标识。服务域名会根据服务域名生成。 命名规范:
|
镜像 | 可选公共镜像和自定义镜像。 公共镜像由官网维护,自定义镜像由用户维护。 针对公共镜像,如果没有您想要的,可以前往聆听反馈提建议,建议提交页面,产品选择“模型在线服务MOS”或“边缘节点计算”,我们相关产品经理再收到您的反馈后,会第一时间进行处理和反馈。 | |
模型配置 | 模型配置最多可设置3组。每组信息均有NFS(文件共享服务实例)、NFS源路径(模型及数据所在文件共享服务实例的路径)、挂载路径(容器的目标挂载路径)组成。 NFS选择已创建好的文件共享服务。 文件共享服务需满足同节点和经典网络的要求。 NFS源路径,可以手动录入模型或数据所在文件共享服务的路径,也可以直接选择已经成功导入的模型路径(会根据导入历史自动提示) 挂载路径,输入容器的目标挂载路径。目前挂载方式均为读写的形式进行挂载。 | |
运行命令 | 镜像内服务的启动命令,例如: | |
端口号 | 镜像启动后监听的本地HTTP端口,范围为1~65535。默认为8000端口。 外部端口无需设置,均为80/443。 | |
环境变量 | 配置镜像内服务启动所依赖的环境变量。键值对,最多支持设置20对。 | |
实例数量 | 实例数量 | 可选范围为1~20。 如需更多实例数量请提交工单告诉我们(产品选择边缘节点计算即可)。 |
4.配置完成后,点击【部署】按钮完成新建。一般1~2分钟即可部署完成,如果镜像较大可能会等待时间较长。
纯净模式