最近更新时间:2025-04-02 10:47:14
GPU资源监控支持查看资源池维度GPU节点的监控数据,详情如下:
节点使用情况
总节点:资源池内总节点
已分配节点:已被任务占用的节点
空闲节点:未被任务占用且状态正常的节点
不可用节点:总节点-已分配节点-空闲节点
CPU&内存总量
CPU核数:资源池内节点累计CPU核数
内存总量:资源池内节点累计内存总量
集群卡分配情况
总卡数:资源池内所有节点累计GPU卡数
已分配卡数:已被任务占用的GPU卡数
空闲卡数:未被任务占用且状态正常的GPU卡数
不可用卡数:总卡数-已分配卡数-空闲卡数
卡使用情况
卡平均利用率:资源池GPU卡使用数量/资源池GPU卡总数
卡显存平均利用率:(资源池GPU卡显存总量-资源池GPU卡可用显存量)/资源池GPU卡显存总量
CPU&内存利用率
CPU平均利用率:
内存利用率:(资源池内存总量-资源池可用内存量)/资源池内存总量
卡分配数、卡分配率、卡利用率、显存利用率近10分钟变化趋势
纯净模式