• 热门
  • 基础
  • 数据库
  • 安全
  • 大数据
  • 人工智能
  • 混合云
  • 开发与运维
  • 企业应用

应用服务

行业引擎

全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

GPU驱动开启持久化模式

最近更新时间:2024-10-24 18:13:50

Persistence-M(Persistence Mode)是一个用户可设置的驱动程序属性的术语。启用持久性模式后,即使没有活动的客户端,NVIDIA驱动程序也会保持加载状态。这样可以最大程度地减少与运行依赖的应用程序(例如 CUDA 程序)相关的驱动程序加载延迟。

执行 nvidia-smi 命令,可查看Persistence Mode当前状态。Persistence-M的值为On时,持续模式为打开状态,如下图所示:

image.png

常见问题

GPU驱动持久化模式为关闭状态时,产生的常见问题如下。

1. GPU指令执行速度缓慢

云服务器GPU相关指令响应速度变慢。

2. GPU云服务器掉卡

GPU云服务器运行中出现掉卡现象,系统message日志报错如下:

Zy8idSPMloxsrkxwwEDc5Tgjnpb1img.jpg

3. GPU利用率异常显示100%

使用GPU计算型实例的过程中,在系统内部使用 nvidia-smi 查看 GPU 状态时,可能遇到没有运行任何使用GPU的应用,但GPU使用率显示100%的情况

4.英伟达驱动无法查找GPU设备

执行 nvidia-smi ,会报错No devices were found,但是执行 lspci |grep -i nvidia 输出正常

解决方案

开启GPU驱动持久化模式。

操作步骤

  1. 单次执行命令

    执行持久模式启动命令sudo nvidia-smi -pm 1

    执行 nvidia-smi 命令,若Persistence-M属性变为On,证明配置生效:

    image.png

  2. 加入系统自启动列表

    修改配置文件sudo vim /etc/rc.local

    在文件中加入以下命令sudo nvidia-smi -pm 1

    使配置生效source /etc/rc.local

    执行 nvidia-smi 命令,若Persistence-M属性变为On,证明配置生效:

    image.png

纯净模式常规模式

纯净模式

点击可全屏预览文档内容

鼠标选中内容,快速反馈问题

如果在文档使用中出现问题,可选中有问题的部分进行快速反馈,我们将跟进处理。
不再提示
好的,我知道了

聆听反馈