最近更新时间:2026-06-17 15:51:32
本实践介绍在 Linux 系统上安装 GPU 驱动的具体操作,涵盖卸载旧驱动、安装新驱动及 CUDA 的完整流程,提供图文安装(交互式)和静默安装(自动化)两种方式。
卸载旧驱动后需要重启设备,以确保旧模块完全释放。
重启后需确认 nvidia 和 nouveau 相关内核模块未加载,否则安装会失败。
若重启后仍有模块残留,需通过 blacklist 方式禁用 nouveau 模块。
静默安装场景下,nvidia-fabricmanager 版本必须与新装驱动版本保持一致,安装驱动后需重新安装对应版本的 fabricmanager。
根据系统版本和所需驱动版本,提前下载以下安装包:
驱动安装包(.run 格式)
CUDA 安装包(如需更新 CUDA)
nvidia-fabricmanager 安装包(静默安装场景)
以下为案例参考:
驱动 550.163.01:Linux-x86_64-550.163.01.run
fabricmanager 550.163.01:nvidia-fabricmanager-550_550.163.01-1_amd64.deb
驱动 535.104.05(Ubuntu 22.04):驱动详情页
驱动 535.104.05(Ubuntu 20.04):驱动详情页
适用于单机或有交互终端的场景,安装过程需手动确认选项。
卸载 nouveau 内核模块:
rmmod nouveau卸载 CUDA:
sudo cuda-uninstaller卸载完毕后需要重启设备,重启后确认相应模块没有加载即可开始安装。
重启设备。
重启后确认以下模块未加载:
lsmod | grep -i nvidia
lsmod | grep nou若重启后仍有 nouveau 模块加载,需执行以下操作。
Ubuntu 系统:
创建或编辑 /etc/modprobe.d/blacklist-nouveau.conf,添加以下内容:
blacklist nouveau
options nouveau modeset=0重新生成 initramfs:
sudo update-initramfs -uRHEL/CentOS 系统:
创建或编辑 /etc/modprobe.d/blacklist-nouveau.conf,添加以下内容:
blacklist nouveau
options nouveau modeset=0重新生成 initramfs:
sudo dracut --force以下以 Ubuntu 系统安装 535.104.05 版本为例。
执行如下命令,若正常输出 GPU 信息,表明驱动安装成功。
sudo nvidia-smi适用于批量部署或脚本化场景,无需人工交互。
systemctl stop nvidia-fabricmanager
systemctl stop nvidia-persistenced
systemctl stop elfin-epc.service
systemctl stop categraf.servicermmod nvidia_uvm
rmmod nvidia_drm
rmmod nvidia_modeset
rmmod nvidia此操作会卸载 fabricmanager,重新安装驱动后需要安装对应版本的 fabricmanager。
/usr/bin/nvidia-uninstall --no-questions --ui=none
/usr/bin/systemctl daemon-reload
apt-get --purge remove nvidia*若不更新 CUDA 可跳过此步骤及后续 CUDA 相关操作。
rm -rf /usr/local/cuda*执行以下命令确认无残留。若均无输出即可安装驱动。若仍有输出,请参考方法一:禁用 nouveau 模块的步骤进行操作。
lsof /dev/nvidia*
fuser -v /dev/nvidia*
lsmod | grep -i nvi
lsmod | grep nou安装驱动:
./NVIDIA-Linux-x86_64-550.163.01.run安装 CUDA(仅安装 Toolkit,不重复安装驱动):
安装 CUDA 时需增加 --toolkit 参数,确保仅安装 CUDA Toolkit 而不安装驱动。
./cuda_12.4.1_550.54.15_linux.run --silent --toolkitexport PATH=/usr/local/cuda-12.4/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64:$LD_LIBRARY_PATH此步骤非常重要,fabricmanager 版本必须与新装驱动版本严格匹配。
确保 fabricmanager 版本与驱动版本一致:
dpkg -i nvidia-fabricmanager-550_550.163.01-1_amd64.debsystemctl start nvidia-fabricmanager
systemctl start nvidia-persistenced
systemctl start elfin-epc.service
systemctl start categraf.service
纯净模式
