全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

查看开发任务详情/监控/日志

最近更新时间:2026-04-29 10:47:36

本文主要介绍开发任务创建成功后,如何查看指定任务的详细信息、监控信息以及日志信息。

前提条件

已成功创建开发任务

进入任务详情页

  1. 登录星流平台,在顶部导航栏,选择训推与仿真 > 开发任务

  2. 开发任务列表页面,点击指定任务名称/ID,即可进入其详情页面。

查看任务监控

开发任务所配置的资源组需提前关联Prometheus实例,具体操作可参考资源组相关内容

  1. 进入任务详情页。

  2. 选择监控页签,即可查看当前开发任务的监控信息。监控详情中可以查看GPU 温度、GPU 平均温度、GPU 总功率、GPU 功率、Tensor Core 利用率、GPU 利用率、GPU Xid 错误、GPU 显存、GPU PCIe 接收速率、GPU PCIe 传输速率、GPU 内存带宽利用率、CPU 和内存利用率、NVLINK 带宽总量、CPU 使用量(核)、Memory 使用量、网络带宽 Receive、网络带宽 Transmit等指标。

查看任务日志

  1. 进入任务详情页。

  2. 选择日志页签,即可查看当前任务的日志信息。

    • 点击右上角的刷新标识,可查看最新的日志信息。

    • 若开启Klog日志服务,则可在当前页面最多查看10000条日志,点击下载按钮也可直接查看完整日志。

查看事件

  1. 进入任务详情页。

  2. 选择事件页签,即可查看当前任务的事件信息。

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈