全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

Ubuntu安装GPU监控agent

最近更新时间:2025-03-31 10:25:09

在GPU实例中,安装了GeForce驱动的GPU才能采集到 GPU 监控数据。本文为您介绍如何为Linux系统的GPU计算型实例手动安装GeForce驱动。

操作步骤

本文适用于所有Linux系统的GPU计算型实例。在该实例上仅支持安装与其操作系统一致的GeForce驱动。

步骤一:下载NVIDIA GeForce驱动

  1. 访问NVIDIA驱动下载页面

  2. 设置搜索条件后,单击“Find”选择适用的驱动程序。

设置项说明如下:

设置项

说明

示例

产品类别、产品系列、产品家族

根据实例规格配备的GPU选择对应的产品类别、产品系列和产品家族。 说明:关于如何查看GPU实例的详细信息,请参见边缘计算>边缘云主机>实例管理>实例详情

GeForce / GeForce RTX 40 Series / NVIDIA GeForce RTX 4090

操作系统

根据实例使用的镜像选择对应的Linux操作系统版本。

Linux 64-bit

语言

选择驱动对应的语言。

English (US)

  1. 在搜索到的驱动页面,单击“View More Versions”。

  2. 找到待下载的驱动,单击对应驱动后的“View”。例如,选择驱动版本为570.133.07。

  3. 在待下载驱动的详情页面,单击“下载”将驱动下载到本地。

注:如果内核版本比较低,比如centos内核一般都比较低,建议选择版本比较低的驱动,否则可能导致安装失败。

  1. 将下载的*.run包拷贝到目标机器(此处略过具体步骤)。

# example:
scp NVIDIA-Linux-x86_64-570.133.07.run root@127.0.0.1:/usr/local

步骤二:安装NVIDIA GeForce驱动

  1. 执行以下命令,查询GPU实例中是否安装kernel-devel和kernel-headers包。

dpkg -l | grep linux-headers
  • 如果回显类似如下信息,即包含了linux-headers和linux-headers-generic 包的版本信息,表示已安装。

# example: apt-get install linux-headers-6.8.0-53-generic
linux-headers-6.8.0-53          
linux-headers-6.8.0-53-generic    
linux-headers-generic             
  • 如果在回显信息中,您没有找到类似linux-headers和linux-headers-generic内容,您需要自行下载并安装kernel对应版本的linux-headers和linux-headers-generic。

  • 重要:linux-headers、linux-headers-generic和kernel版本不一致会导致在安装driver过程中driver编译出错。因此,请您确认回显信息中kernel-*的版本号后,再下载对应版本的inux-headers、linux-headers-generic。在示例回显信息中,kernel的版本号为6.8.0-53。

  1. 安装gcc以及make

apt-get install -y gcc make
  1. 禁用 Nouveau 模块

/etc/default/grub
# 到 GRUB_CMDLINE_LINUX_DEFAULT 这一行,并添加 nouveau.modeset=0
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash nouveau.modeset=0
  1. 更新 grub 配置

sudo update-grub
  1. 防止 Nouveau 模块被加载

  • 创建一个名为/etc/modprobe.d/blacklist-nouveau.conf的文件并添加一下内容以禁用 Nouveau被加载

blacklist nouveau
options nouveau modeset=0
  • 更新 initramfs

sudo update-initramfs -u
  • 重启系统以使更改生效

sudo reboot
  1. 授权并安装GeForce驱动。以操作系统是Linux 64-bit的驱动为例,推荐您使用.run形式的GeForce驱动,例如:NVIDIA-Linux-x86_64-570.133.07.run。分别执行以下命令,授权并安装GeForce驱动。

chmod +x NVIDIA-Linux-x86_64-570.133.07.run
# 以ubuntu为例--kernel-source-path为linux-headers-generic实际目录,根据实际情况调整
./NVIDIA-Linux-x86_64-570.133.07.run --kernel-source-path=/usr/src/linux-headers-5.15.0-119-generic
  1. 执行以下命令,查看GeForce驱动是否安装成功。

nvidia-smi
  • 回显信息类似如下所示,表示GeForce驱动安装成功。

纯净模式常规模式

纯净模式

点击可全屏预览文档内容