GPU资源监控支持查看资源池维度GPU节点的监控数据,详情如下:
节点使用情况
总节点:资源池内总节点
已分配节点:已被任务占用的节点
空闲节点:未被任务占用且状态正常的节点
不可用节点:总节点-已分配节点-空闲节点

CPU&内存总量
CPU核数:资源池内节点累计CPU核数
内存总量:资源池内节点累计内存总量

集群卡分配情况
总卡数:资源池内所有节点累计GPU卡数
已分配卡数:已被任务占用的GPU卡数
空闲卡数:未被任务占用且状态正常的GPU卡数
不可用卡数:总卡数-已分配卡数-空闲卡数

卡使用情况
CPU&内存利用率
卡分配数、卡分配率、卡利用率、显存利用率近10分钟变化趋势
