最近更新时间:2024-01-15 19:50:21
Persistence-M(Persistence Mode)是一个用户可设置的驱动程序属性的术语。启用持久性模式后,即使没有活动的客户端,NVIDIA驱动程序也会保持加载状态。这样可以最大程度地减少与运行依赖的应用程序(例如 CUDA 程序)相关的驱动程序加载延迟。
执行 nvidia-smi 命令,可查看Persistence Mode当前状态。Persistence-M的值为On时,持续模式为打开状态,如下图所示:
GPU驱动持久化模式为关闭状态时,产生的常见问题如下。
云服务器GPU相关指令响应速度变慢。
GPU云服务器运行中出现掉卡现象,系统message日志报错如下:
使用GPU计算型实例的过程中,在系统内部使用 nvidia-smi 查看 GPU 状态时,可能遇到没有运行任何使用GPU的应用,但GPU使用率显示100%的情况
执行 nvidia-smi ,会报错No devices were found,但是执行 lspci |grep -i nvidia 输出正常
开启GPU驱动持久化模式。
执行持久模式启动命令
sudo nvidia-smi -pm 1
执行 nvidia-smi 命令,若Persistence-M属性变为On,证明配置生效:
修改配置文件
sudo vim /etc/rc.local
在文件中加入以下命令
sudo nvidia-smi -pm 1
使配置生效
source /etc/rc.local
执行 nvidia-smi 命令,若Persistence-M属性变为On,证明配置生效:
纯净模式