全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

Isaac Sim5.0版本容器仿真服务

最近更新时间:2025-10-30 15:30:33

仿真背景介绍

Isaac Sim‌是由NVIDIA开发的一款高性能机器人仿真平台,基于NVIDIA Omniverse构建,专注于机器人仿真、人工智能训练和虚拟测试。Isaac Sim的核心特点包括高保真物理仿真、传感器模拟、AI和机器学习集成、多用户协作和实时渲染等功能。

1.1功能特点

  • 高保真物理仿真‌:基于NVIDIA PhysX物理引擎,支持精确的物理交互和动力学仿真‌。

  • 传感器模拟‌:支持多种传感器模型,包括摄像头、激光雷达、深度相机、IMU等,提供逼真的传感器数据输出,适用于训练和测试AI算法‌。

  • AI和机器学习集成‌:内置NVIDIA Isaac SDK,支持深度学习模型的训练和部署,提供预训练的AI模型(如目标检测、语义分割)。

  • 多用户协作和实时渲染‌:基于NVIDIA Omniverse,支持USD(Universal Scene Description)格式,便于场景共享和扩展‌。

  • 模块化和可扩展‌:提供Python和C++ API,支持自定义仿真逻辑和插件开发‌。

1.2应用场景

  • 机器人开发‌:仿真机器人运动控制、路径规划和抓取任务‌。

  • 自动驾驶‌:仿真自动驾驶汽车的传感器数据和环境交互‌。

  • 工业自动化‌:仿真工业机器人、AGV(自动导引车)和生产线‌。

  • AI训练‌:生成合成数据用于训练深度学习模型‌。

  • 虚拟测试‌:在虚拟环境中测试机器人算法和系统,减少对物理硬件的依赖。

1.3版本更新

最新发布了Isaac Sim 5.0版本仿真,该版本相较于4.5有了较多更新,比如在直播上不再支持Omniverse 流式处理客户端,用户体验以及使用界面上,新增了使用新的机器人向导,简化了CAD文件或者简单形状的机器人设置以及传感器工具;另外更新了较多的套件,并支持Neural渲染等。其它更加详细的说明可参考NVIDIA官方说明Release Notes — Isaac Sim Documentation

1.4部署方式

  • 云服务器部署:

    • 适用场景:适用于资源需求稳定、无需频繁扩缩容的业务,隔离性强,部署简单快捷。

    • 使用步骤:新建云服务器配置实例信息后使用远程桌面启动仿真服务。

  • 容器部署:

    • 适用场景:适用于高弹性需求的业务,可以更方便的分配资源,支持即开即用。

    • 使用步骤:需创建容器集群和资源池后新建开发任务,使用IDE和基于容器的远程访问工具启动仿真服务。

前提条件

  • 您已登录金山云并完成账号注册流程https://www.ksyun.com/

  • 您已具备使用星流平台和容器服务的权限,可联系商务支持

  • 了解或使用过NVIDIA Isaac sim仿真平台,并具备一定的仿真能力

  • 本次仿真连接使用基于kasmVNC客户端并通过网页的形式打开仿真平台,建议浏览器使用chrome

  • 本次sim5.0版本仅支持容器方式启动部署开展仿真服务,如需NoMachine客户端或WebRTC客户端,可使用基于云主机+sim4.5的方式使用

基本概念

术语

定义

星流平台

训推平台为机器学习场景开发者和运维人员提供云原生AI算力和全流程管理能力支持,由基础资源管理、算力管理工具、训推任务管理、资产与权限管理等模块构成,包含GPU故障自愈、任务可观测性、任务编排调度等核心特性。

仿真服务

仿真服务是金山云星流训推平台其中一项应用产品。

Isaac Sim

基于NVIDIA Omniverse 构建的应用,是一个机器人仿真工具,覆盖从环境构建到硬件部署的全流程,提供了物理引擎、传感器模拟、数据合成等能力,帮助开发者创建类似真实的虚拟环境,用户机器人的设计、仿真、测试等。

Isaac Lab

构建在Isaac Sim之上的轻量级开源机器人框架,专注强化学习、训练等功能,适用于机器人学习和控制的研发和开发,例如通过强化学习训练机器人完成复杂的操作任务。

容器服务

原生的Kubernetes进行开发和适配,整合了金山云虚拟化、网络、存储等能力,为客户提供高可靠、高性能、高度可扩展的容器管理服务。支持资源调度、服务发现、灰度升级,弹性伸缩和服务编排等功能特性,方便用户在金山云容器平台轻松部署、运维容器化的应用。

kasmVNC

是一款基于浏览器访问远程桌面的解决方案,通过浏览器直接访问远程桌面,无需安装传统VNC客户端。

技术指标

产品

指标

ESSD云硬盘

提供3档高性能云硬盘,分别为PL0(IOPS:1.1万,吞吐:180MB/s)、PL1(IOPS:5.5万,吞吐:350MB/s)、PL2(IOPS:12万,吞吐:1000MB/s)注1

注1:上述性能指标指单盘性能上限。官方文档指引https://docs.ksyun.com/products/29

监控详情

磁盘空间利用率、网络、CPU、GPU、内存、进程等监控。具体指标请参考金山云官方文档指引https://monitor.console.ksyun.com/

弹性IP

主要用于仿真平台的登录和连接使用。计费方式以及使用限制参考官方指引https://docs.ksyun.com/products/23

托管集群

金山云容器服务提供Master和ETCD全托管的集群,用户只需要创建集群的Worker节点,无需关心集群的控制管理平面。

节点

节点为注册到容器集群的单一服务器资源,可以是云服务器、裸金属服务器、GPU服务器等等。其它容器指标可参考官方指引https://docs.ksyun.com/directories/2418?type=1

开机流程

  • 概览先知

  1. 创建GDP401云资源

  2. 创建容器集群

  3. 将资源加入容器集群

  4. 创建资源池关联容器集群

  5. 创建队列

  6. 创建开发任务

  7. kasmVNC连接使用

创建云主机

以GDP401云服务器为例

1. 登录金山云平台,切换至控制台界面,选择云服务器

2. 选择区域,点击新建后,选择相应的资源完成云主机创建,并在创建完成后关机;云服务器详细创建流程可参见https://docs.ksyun.com/documents/5338

容器服务

  • 创建容器集群-集群配置

1.登录金山云控制台,选择容器服务

2.选择相应区域后,点击新建集群

3.配置集群信息,集群配置可按照如下填写

  • 基本信息

集群名称

用户自定义集群的名称,2-64个字符,支持中文,英文,数字,以及特殊字符-,.!$^*()%#&+/:;<=>[]_`{|}~

数据中心

选择所用的数据中心,建议和创建的云主机区域保持一致

Kubernetes版本

默认即可(1.27.7)

计费方式

按需选择

Master管理模式

选择托管方式

  • 网络信息

集群网络

选择集群所在的VPC网络当所选Master管理模式为托管模式时,需为托管的控制面节点配置所在子网。控制面节点会至少占用所选子网的三个IP。当选择不同可用区的多个子网时,各控制节点会优先选择不同可用区子网进行高可用部署。

普通子网

选择集群网络后,会自动带出普通子网信息

终端子网

终端子网用于创建私网负载均衡,用于集群内master节点和node节点通信。如果没有,点击下方的提示新建即可

网络模型

默认即可

网络配置

为集群内的Pod分配此网络地址段的IP,客户自定义三个私有网络作为Pod网段。直接填写私网即可(Pod CIDR不能和集群所在VPC的CIDR、Service CIDR冲突)

VPC-CNI模式

-

Service CIDR

随机分配即可。为集群内的Service分配此网络地址段的IP,客户自定义三个私有网络作为Service网段(系统将为集群内的service分配此地址范围内的IP地址,Service CIDR不能和集群所在VPC的CIDR、Pod CIDR冲突

  • 创建容器集群-节点配置

可按照如下流程增加节点配置信息

节点来源

选择新建实例

计费方式

按需选择计费类型

数据中心

选择区域,默认和前面创建集群时选择的一样

节点类型

选择普通云主机

Master&Etcd机型

默认(无需选择)

Worker机型

该节点配置和创建云服务器类型,具体创建不再赘述。(特别注意:其中镜像随机选择一个Ubuntu即可,购买数量选择1台)

容器运行时

默认

容器存储目录

默认

安全组

默认

  • 创建容器集群-组件配置

默认并点击下一步即可

  • 创建容器集群-设置基本信息

填写相应信息即可完成整个集群创建的流程。

这里服务器信息指的是前面创建的Worker节点信息,即云服务器信息。

  • 容器集群添加节点

1.容器集群创建完成后,点击集群进入详情配置页面,在左侧导航栏点击节点并选择“+添加已有节点

注意:添加节点时会发现已经有一个节点在运行,这是前面创建集群时添加的节点(Worker机型),此时建议先直接移除节点,然后再添加最开始创建的云主机

2.选择之前创建的云服务器,镜像信息选择带有550.163驱动版本的系统,其它信息默认即可。

3.集群节点添加后,等待容器组件安装完成后,表示容器集群创建完成。

星流平台

  • 创建资源池

1.登录金山云控制台,选择星流平台

2.新建资源池,点击右侧+新建

  • 基本信息

资源组名称

按照提示随意写即可

描述

选填

资源组类型

默认

  • 资源配置

地域

选择和容器集群在一个区域内即可

依赖项检查

默认,如有类似依赖项可先忽略检查

VPC与集群

选择VPC和容器集群

高性能KPFS

如不需要,可不用勾选

组件配置

按需选择,可不选

资源可观测性

当前场景下可不选

依赖项检查

网络与存储选择

网络监控组件

  • 新建队列

每个队列均可添加全部GPU资源,划分队列时请做好资源规划,以防资源抢占影响任务启动
队列可设置成员,准许指定子用户使用

分配GPU资源,用于后续具体任务的创建。点击进入资源池队列管理,新建队列,并配置以下选项。

资源组

默认会自动带出

队列名称

队列名称,按照框内提示写即可

队列描述

可选

队列管理员

默认当前金山云账号

队列成员

可选

GPU配置

默认会自动带出,如没有带出可选择前期创建的机型,数量代表台数,一台就填写1

CPU配置

可填写全部的GPU资源,也可以规划指定用户可使用的资源量,例如原主机资源规格是32C64G,可填写全部规格,也可以写1C1G

  • 新建开发任务

1.新建任务

在星流平台左侧导航栏中,选择训练与推理,点击开发任务

2.基本信息

任务名称

按照提示写即可

任务描述

可选

3.环境配置

选择仿真容器镜像,如sim5.0版本

4.资源配置

开发任务中,单任务最多使用单机8卡,不可多机使用
开发任务停止时不会保存数据,关闭再启动时会使用原始镜像启动,关闭任务前请保存镜像,或开启【自动保存镜像】功能
重要数据建议放入KPFS持久化保存,挂载的KPFS数据不会随任务停止而删除

资源组

默认自动带出

队列

默认为队列创建时的名称

资源规格

可按需填写,例如填写所有资源

5.挂载配置

挂载配置可选对象存储KS3和文件存储KPFS,如需要可选择相应配置

6.访问配置

1)支持配置SSH访问,开启后需配置SSH公钥,可按需选择。

2)自定义服务打开4000端口并开启公网访问。

3)公网地址若无新建即可,关于弹性IP新建,可参考流程指引弹性IP产品使用文档

7.权限配置

按照提示按需选择即可

kasmVNC连接使用

连接任务

启动成功后,点击连接,通过任意方式连接到容器终端

选择开发工具

1.任务右侧【连接】中,点击Jupyter后,会弹出新标签页(Web Jupyter),可在该页面对任务进行开发

2.进入终端内执行/docker_config/entrypoint.sh启动kamsvnc远程桌面服务(以Jupyter为例)

登录仿真服务

启动成功后,使用浏览器访问 https://<自定义服务公网IP>:4000 以连接远程桌面(推荐chrome),连接登录账号密码默认为root+kasmvncpasswd,登陆后即可远程使用仿真服务。

建议您仔细阅读桌面的readme.md文档以了解当前镜像中服务的部署与使用方式。

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈