全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

GPU资源监控

最近更新时间:2025-04-02 10:47:14

GPU资源监控支持查看资源池维度GPU节点的监控数据,详情如下:

  1. 节点使用情况

    • 总节点:资源池内总节点

    • 已分配节点:已被任务占用的节点

    • 空闲节点:未被任务占用且状态正常的节点

    • 不可用节点:总节点-已分配节点-空闲节点

  2. CPU&内存总量

    • CPU核数:资源池内节点累计CPU核数

    • 内存总量:资源池内节点累计内存总量

  3. 集群卡分配情况

    • 总卡数:资源池内所有节点累计GPU卡数

    • 已分配卡数:已被任务占用的GPU卡数

    • 空闲卡数:未被任务占用且状态正常的GPU卡数

    • 不可用卡数:总卡数-已分配卡数-空闲卡数

  4. 卡使用情况

    • 卡平均利用率:资源池GPU卡使用数量/资源池GPU卡总数

    • 卡显存平均利用率:(资源池GPU卡显存总量-资源池GPU卡可用显存量)/资源池GPU卡显存总量

  5. CPU&内存利用率

    • CPU平均利用率:

    • 内存利用率:(资源池内存总量-资源池可用内存量)/资源池内存总量

  6. 卡分配数、卡分配率、卡利用率、显存利用率近10分钟变化趋势

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容