全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

GPU驱动开启持久化模式

最近更新时间:2024-01-15 19:50:21

GPU驱动持久化模式

Persistence-M(Persistence Mode)是一个用户可设置的驱动程序属性的术语。启用持久性模式后,即使没有活动的客户端,NVIDIA驱动程序也会保持加载状态。这样可以最大程度地减少与运行依赖的应用程序(例如 CUDA 程序)相关的驱动程序加载延迟。

执行 nvidia-smi 命令,可查看Persistence Mode当前状态。Persistence-M的值为On时,持续模式为打开状态,如下图所示:

image.png

常见问题

GPU驱动持久化模式为关闭状态时,产生的常见问题如下。

1. GPU指令执行速度缓慢

云服务器GPU相关指令响应速度变慢。

2. GPU云服务器掉卡

GPU云服务器运行中出现掉卡现象,系统message日志报错如下:

Zy8idSPMloxsrkxwwEDc5Tgjnpb1img.jpg

3. GPU利用率异常显示100%

使用GPU计算型实例的过程中,在系统内部使用 nvidia-smi 查看 GPU 状态时,可能遇到没有运行任何使用GPU的应用,但GPU使用率显示100%的情况

4.英伟达驱动无法查找GPU设备

执行 nvidia-smi ,会报错No devices were found,但是执行 lspci |grep -i nvidia 输出正常

解决方案

开启GPU驱动持久化模式。

1. 单次执行命令

执行持久模式启动命令

sudo nvidia-smi -pm 1

执行 nvidia-smi 命令,若Persistence-M属性变为On,证明配置生效:

image.png

2. 加入系统自启动列表

修改配置文件

sudo vim /etc/rc.local

在文件中加入以下命令

sudo nvidia-smi -pm 1

使配置生效

source /etc/rc.local

执行 nvidia-smi 命令,若Persistence-M属性变为On,证明配置生效:

image.png

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈