全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

Centos安装GPU监控agent

最近更新时间:2025-03-31 10:25:09

在GPU实例中,安装了GeForce驱动的GPU才能采集到 GPU 监控数据。本文为您介绍如何为Linux系统的GPU计算型实例手动安装GeForce驱动。

操作步骤

本文适用于所有Linux系统的GPU计算型实例。在该实例上仅支持安装与其操作系统一致的GeForce驱动。

步骤一:下载NVIDIA GeForce驱动

  1. 访问NVIDIA驱动下载页面

  2. 设置搜索条件后,单击“Find”选择适用的驱动程序。

设置项说明如下:

设置项

说明

示例

产品类别、产品系列、产品家族

根据实例规格配备的GPU选择对应的产品类别、产品系列和产品家族。 说明:关于如何查看GPU实例的详细信息,请参见边缘计算>边缘云主机>实例管理>实例详情

GeForce / GeForce RTX 40 Series / NVIDIA GeForce RTX 4090

操作系统

根据实例使用的镜像选择对应的Linux操作系统版本。

Linux 64-bit

语言

选择驱动对应的语言。

English (US)

  1. 在搜索到的驱动页面,单击“View More Versions”。

  2. 找到待下载的驱动,单击对应驱动后的“View”。例如,选择驱动版本为570.133.07。

  3. 在待下载驱动的详情页面,单击“下载”将驱动下载到本地。

注:如果内核版本比较低,比如centos内核一般都比较低,建议选择版本比较低的驱动,否则可能导致安装失败。

  1. 将下载的*.run包拷贝到目标机器(此处略过具体步骤)。

# example:
scp NVIDIA-Linux-x86_64-570.133.07.run root@127.0.0.1:/usr/local

步骤二:安装NVIDIA GeForce驱动

  1. 执行以下命令,查询GPU实例中是否安装kernel-devel和kernel-headers包。

sudo rpm -qa | grep $(uname -r)
  • 如果回显类似如下信息,即包含了kernel-devel和kernel-headers包的版本信息,表示已安装。

# https://buildlogs.centos.org/c7.2003.00.x86_64/kernel/20200331233310 找对应版本
kernel-3.10.0-1062.18.1.el7.x86_64
kernel-devel-3.10.0-1062.18.1.el7.x86_64
kernel-headers-3.10.0-1062.18.1.el7.x86_64           
  • 如果在回显信息中,您没有找到类似kernel-devel-*和kernel-headers-*内容,您需要自行下载并安装kernel对应版本的kernel-devel和kernel-headers包。

  • 重要:kernel-devel、kernel-headers和kernel版本不一致会导致在安装driver过程中driver编译出错。因此,请您确认回显信息中kernel-*的版本号后,再下载对应版本的kernel-devel、kernel-headers。在示例回显信息中,kernel的版本号为3.10.0-1062.18.1.el7.x86_64。

  1. 安装gcc以及make

# centos
yum install -y gcc make
  1. 授权并安装GeForce驱动。以操作系统是Linux 64-bit的驱动为例,推荐您使用.run形式的GeForce驱动,例如:NVIDIA-Linux-x86_64-570.133.07.run。分别执行以下命令,授权并安装GeForce驱动。

chmod +x NVIDIA-Linux-x86_64-570.133.07.run
# 以ubuntu为例--kernel-source-path为linux-headers-generic实际目录,根据实际情况调整
./NVIDIA-Linux-x86_64-570.133.07.run --kernel-source-path=/usr/src/linux-headers-5.15.0-119-generic
  1. 执行以下命令,查看GeForce驱动是否安装成功。

nvidia-smi
  • 回显信息类似如下所示,表示GeForce驱动安装成功。

纯净模式常规模式

纯净模式

点击可全屏预览文档内容