最近更新时间:2025-10-30 15:30:33
Isaac Sim是由NVIDIA开发的一款高性能机器人仿真平台,基于NVIDIA Omniverse构建,专注于机器人仿真、人工智能训练和虚拟测试。Isaac Sim的核心特点包括高保真物理仿真、传感器模拟、AI和机器学习集成、多用户协作和实时渲染等功能。
高保真物理仿真:基于NVIDIA PhysX物理引擎,支持精确的物理交互和动力学仿真。
传感器模拟:支持多种传感器模型,包括摄像头、激光雷达、深度相机、IMU等,提供逼真的传感器数据输出,适用于训练和测试AI算法。
AI和机器学习集成:内置NVIDIA Isaac SDK,支持深度学习模型的训练和部署,提供预训练的AI模型(如目标检测、语义分割)。
多用户协作和实时渲染:基于NVIDIA Omniverse,支持USD(Universal Scene Description)格式,便于场景共享和扩展。
模块化和可扩展:提供Python和C++ API,支持自定义仿真逻辑和插件开发。
机器人开发:仿真机器人运动控制、路径规划和抓取任务。
自动驾驶:仿真自动驾驶汽车的传感器数据和环境交互。
工业自动化:仿真工业机器人、AGV(自动导引车)和生产线。
AI训练:生成合成数据用于训练深度学习模型。
虚拟测试:在虚拟环境中测试机器人算法和系统,减少对物理硬件的依赖。
最新发布了Isaac Sim 5.0版本仿真,该版本相较于4.5有了较多更新,比如在直播上不再支持Omniverse 流式处理客户端,用户体验以及使用界面上,新增了使用新的机器人向导,简化了CAD文件或者简单形状的机器人设置以及传感器工具;另外更新了较多的套件,并支持Neural渲染等。其它更加详细的说明可参考NVIDIA官方说明Release Notes — Isaac Sim Documentation
云服务器部署:
适用场景:适用于资源需求稳定、无需频繁扩缩容的业务,隔离性强,部署简单快捷。
使用步骤:新建云服务器配置实例信息后使用远程桌面启动仿真服务。
容器部署:
适用场景:适用于高弹性需求的业务,可以更方便的分配资源,支持即开即用。
使用步骤:需创建容器集群和资源池后新建开发任务,使用IDE和基于容器的远程访问工具启动仿真服务。
您已登录金山云并完成账号注册流程https://www.ksyun.com/
您已具备使用星流平台和容器服务的权限,可联系商务支持
了解或使用过NVIDIA Isaac sim仿真平台,并具备一定的仿真能力
本次仿真连接使用基于kasmVNC客户端并通过网页的形式打开仿真平台,建议浏览器使用chrome
本次sim5.0版本仅支持容器方式启动部署开展仿真服务,如需NoMachine客户端或WebRTC客户端,可使用基于云主机+sim4.5的方式使用
术语 | 定义 |
星流平台 | 训推平台为机器学习场景开发者和运维人员提供云原生AI算力和全流程管理能力支持,由基础资源管理、算力管理工具、训推任务管理、资产与权限管理等模块构成,包含GPU故障自愈、任务可观测性、任务编排调度等核心特性。 |
仿真服务 | 仿真服务是金山云星流训推平台其中一项应用产品。 |
Isaac Sim | 基于NVIDIA Omniverse 构建的应用,是一个机器人仿真工具,覆盖从环境构建到硬件部署的全流程,提供了物理引擎、传感器模拟、数据合成等能力,帮助开发者创建类似真实的虚拟环境,用户机器人的设计、仿真、测试等。 |
Isaac Lab | 构建在Isaac Sim之上的轻量级开源机器人框架,专注强化学习、训练等功能,适用于机器人学习和控制的研发和开发,例如通过强化学习训练机器人完成复杂的操作任务。 |
容器服务 | 原生的Kubernetes进行开发和适配,整合了金山云虚拟化、网络、存储等能力,为客户提供高可靠、高性能、高度可扩展的容器管理服务。支持资源调度、服务发现、灰度升级,弹性伸缩和服务编排等功能特性,方便用户在金山云容器平台轻松部署、运维容器化的应用。 |
kasmVNC | 是一款基于浏览器访问远程桌面的解决方案,通过浏览器直接访问远程桌面,无需安装传统VNC客户端。 |
产品 | 指标 |
ESSD云硬盘 | 提供3档高性能云硬盘,分别为PL0(IOPS:1.1万,吞吐:180MB/s)、PL1(IOPS:5.5万,吞吐:350MB/s)、PL2(IOPS:12万,吞吐:1000MB/s)注1
|
监控详情 | 磁盘空间利用率、网络、CPU、GPU、内存、进程等监控。具体指标请参考金山云官方文档指引https://monitor.console.ksyun.com/ |
弹性IP | 主要用于仿真平台的登录和连接使用。计费方式以及使用限制参考官方指引https://docs.ksyun.com/products/23 |
托管集群 | 金山云容器服务提供Master和ETCD全托管的集群,用户只需要创建集群的Worker节点,无需关心集群的控制管理平面。 |
节点 | 节点为注册到容器集群的单一服务器资源,可以是云服务器、裸金属服务器、GPU服务器等等。其它容器指标可参考官方指引https://docs.ksyun.com/directories/2418?type=1 |
概览先知
创建GDP401云资源
创建容器集群
将资源加入容器集群
创建资源池关联容器集群
创建队列
创建开发任务
kasmVNC连接使用
以GDP401云服务器为例
1. 登录金山云平台,切换至控制台界面,选择云服务器
2. 选择区域,点击新建后,选择相应的资源完成云主机创建,并在创建完成后关机;云服务器详细创建流程可参见https://docs.ksyun.com/documents/5338
创建容器集群-集群配置
1.登录金山云控制台,选择容器服务
2.选择相应区域后,点击新建集群
3.配置集群信息,集群配置可按照如下填写
基本信息
集群名称 | 用户自定义集群的名称,2-64个字符,支持中文,英文,数字,以及特殊字符-,.!$^*()%#&+/:;<=>[]_`{|}~ |
数据中心 | 选择所用的数据中心,建议和创建的云主机区域保持一致 |
Kubernetes版本 | 默认即可(1.27.7) |
计费方式 | 按需选择 |
Master管理模式 | 选择托管方式 |
网络信息
集群网络 | 选择集群所在的VPC网络。当所选Master管理模式为托管模式时,需为托管的控制面节点配置所在子网。控制面节点会至少占用所选子网的三个IP。当选择不同可用区的多个子网时,各控制节点会优先选择不同可用区子网进行高可用部署。 |
普通子网 | 选择集群网络后,会自动带出普通子网信息 |
终端子网 | 终端子网用于创建私网负载均衡,用于集群内master节点和node节点通信。如果没有,点击下方的提示新建即可 |
网络模型 | 默认即可 |
网络配置 | 为集群内的Pod分配此网络地址段的IP,客户自定义三个私有网络作为Pod网段。直接填写私网即可(Pod CIDR不能和集群所在VPC的CIDR、Service CIDR冲突) |
VPC-CNI模式 | - |
Service CIDR | 随机分配即可。为集群内的Service分配此网络地址段的IP,客户自定义三个私有网络作为Service网段(系统将为集群内的service分配此地址范围内的IP地址,Service CIDR不能和集群所在VPC的CIDR、Pod CIDR冲突) |
创建容器集群-节点配置
可按照如下流程增加节点配置信息
节点来源 | 选择新建实例 |
计费方式 | 按需选择计费类型 |
数据中心 | 选择区域,默认和前面创建集群时选择的一样 |
节点类型 | 选择普通云主机 |
Master&Etcd机型 | 默认(无需选择) |
Worker机型 | 该节点配置和创建云服务器类型,具体创建不再赘述。(特别注意:其中镜像随机选择一个Ubuntu即可,购买数量选择1台) |
容器运行时 | 默认 |
容器存储目录 | 默认 |
安全组 | 默认 |
创建容器集群-组件配置
默认并点击下一步即可
创建容器集群-设置基本信息
填写相应信息即可完成整个集群创建的流程。
这里服务器信息指的是前面创建的Worker节点信息,即云服务器信息。
容器集群添加节点
1.容器集群创建完成后,点击集群进入详情配置页面,在左侧导航栏点击节点并选择“+添加已有节点”
注意:添加节点时会发现已经有一个节点在运行,这是前面创建集群时添加的节点(Worker机型),此时建议先直接移除节点,然后再添加最开始创建的云主机
2.选择之前创建的云服务器,镜像信息选择带有550.163驱动版本的系统,其它信息默认即可。
3.集群节点添加后,等待容器组件安装完成后,表示容器集群创建完成。
创建资源池
1.登录金山云控制台,选择星流平台
2.新建资源池,点击右侧+新建
基本信息
资源组名称 | 按照提示随意写即可 |
描述 | 选填 |
资源组类型 | 默认 |
资源配置
地域 | 选择和容器集群在一个区域内即可 |
依赖项检查 | 默认,如有类似依赖项可先忽略检查 |
VPC与集群 | 选择VPC和容器集群 |
高性能KPFS | 如不需要,可不用勾选 |
组件配置 | 按需选择,可不选 |
资源可观测性 | 当前场景下可不选 |
依赖项检查
网络与存储选择
网络监控组件
新建队列
每个队列均可添加全部GPU资源,划分队列时请做好资源规划,以防资源抢占影响任务启动
队列可设置成员,准许指定子用户使用
分配GPU资源,用于后续具体任务的创建。点击进入资源池队列管理,新建队列,并配置以下选项。
资源组 | 默认会自动带出 |
队列名称 | 队列名称,按照框内提示写即可 |
队列描述 | 可选 |
队列管理员 | 默认当前金山云账号 |
队列成员 | 可选 |
GPU配置 | 默认会自动带出,如没有带出可选择前期创建的机型,数量代表台数,一台就填写1 |
CPU配置 | 可填写全部的GPU资源,也可以规划指定用户可使用的资源量,例如原主机资源规格是32C64G,可填写全部规格,也可以写1C1G |
新建开发任务
1.新建任务
在星流平台左侧导航栏中,选择训练与推理,点击开发任务
2.基本信息
任务名称 | 按照提示写即可 |
任务描述 | 可选 |
3.环境配置
选择仿真容器镜像,如sim5.0版本
4.资源配置
开发任务中,单任务最多使用单机8卡,不可多机使用
开发任务停止时不会保存数据,关闭再启动时会使用原始镜像启动,关闭任务前请保存镜像,或开启【自动保存镜像】功能
重要数据建议放入KPFS持久化保存,挂载的KPFS数据不会随任务停止而删除
资源组 | 默认自动带出 |
队列 | 默认为队列创建时的名称 |
资源规格 | 可按需填写,例如填写所有资源 |
5.挂载配置
挂载配置可选对象存储KS3和文件存储KPFS,如需要可选择相应配置
6.访问配置
1)支持配置SSH访问,开启后需配置SSH公钥,可按需选择。
2)自定义服务打开4000端口并开启公网访问。
3)公网地址若无新建即可,关于弹性IP新建,可参考流程指引弹性IP产品使用文档
7.权限配置
按照提示按需选择即可
启动成功后,点击连接,通过任意方式连接到容器终端
1.任务右侧【连接】中,点击Jupyter后,会弹出新标签页(Web Jupyter),可在该页面对任务进行开发
2.进入终端内执行/docker_config/entrypoint.sh启动kamsvnc远程桌面服务(以Jupyter为例)
启动成功后,使用浏览器访问 https://<自定义服务公网IP>:4000 以连接远程桌面(推荐chrome),连接登录账号密码默认为root+kasmvncpasswd,登陆后即可远程使用仿真服务。
建议您仔细阅读桌面的readme.md文档以了解当前镜像中服务的部署与使用方式。
纯净模式
