全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

在GPU实例中安装驱动和CUDA

最近更新时间:2026-03-31 12:01:49

在GPU实例中安装驱动是启用GPU计算能力的关键步骤。本文将介绍金山云GPU实例的预装镜像、CUDA版本与机型的匹配建议,以及驱动安装的具体方法。

安装方法

说明

预装CUDA版本的公共镜像

创建GPU实例时,选择预装了CUDA的公共镜像(推荐CUDA 12.x及以上版本)

手动安装

创建GPU实例后,手动安装驱动

脚本安装

创建GPU实例时,在高级设置-自定义数据区域输入自动安装脚本来安装驱动

预装CUDA版本的公共镜像

金山云为GPU云服务器提供了预装CUDA驱动和开发工具包的标准镜像,可以显著简化部署流程。根据镜像列表,目前支持以下预装CUDA的镜像:

机型

公共镜像

CUDA版本

驱动版本

cuDNN版本

GPU推理Ⅱ型GN6I

GPU通用计算型P4V

GPU高效计算型P6V

GPU通用计算型GN7I

GPU通用计算型GN8I

CentOS-7.9 CUDA12.4

Ubuntu-22.04 CUDA12.4

12.4.131

550.127.08

9.2.0

GPU推理Ⅱ型GN6I

CentOS-7.6 CUDA10.2

Ubuntu-18.04 CUDA10.2

10.2.89

440.33.01

7.6.5

GPU推理Ⅱ型GN6I

CentOS-7.3 CUDA8.0

CentOS-7.2 CUDA8.0

Ubuntu-16.04 CUDA8.0

8.0.61

--

--

GPU推理Ⅱ型GN6I

Centos-7.3 CUDA9.1

Centos-7.2 CUDA9.1

Ubuntu-16.04 CUDA9.1

9.1.85

--

--

选择合适的CUDA版本主要取决于您的GPU机型应用程序框架的需求。以下是通用的选择建议:

  • 新购机型(如GN7I、GN8I、P6V等) :建议选择 CUDA 12.x 版本。较新的GPU架构对CUDA 12有更好的优化和支持,同时主流AI框架的最新版本也多基于CUDA 12进行编译。

  • 旧版机型或特定环境:如果您使用的是较早的GPU型号(如P4V),或者需要运行特定的旧版软件,可能需要选择 CUDA 11.x 或更早版本。此时可以选择标准镜像(不含CUDA)自行安装指定版本,以确保兼容性。

注意:如果您需要vGPU功能(将一块GPU分割成多个虚拟GPU),则必须安装GRID驱动,并配合对应的License使用(如vDWS、vPC、vCS)。

手动安装CUDA和驱动

根据操作系统的不同,安装方式有所区别。以下介绍在Linux和Windows环境下的安装方法。

机型

显卡

GPU高效计算型P6V

A800

GPU通用计算型P4V

Tesla V100

GPU通用计算型GN7I

A10

GPU通用计算型GN81

RTX 4090

GPU推理II型GN6I

Tesla T4

Linux环境(以Ubuntu/CentOS为例)

如果您需要安装特定版本的CUDA,可以前往官网下载。

  1. 下载Runfile:访问CUDA下载页面,选择对应的操作系统架构,推荐下载 runfile (local) 类型的安装包。

  2. 安装驱动和CUDA

# 添加执行权限并运行
sudo sh cuda_版本号_linux.run
  1. 配置环境变量:安装完成后,建议将CUDA路径添加到~/.bashrc中:

export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source ~/.bashrc
  1. 验证安装

# 查看驱动版本
nvidia-smi
# 编译并运行示例程序
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
make
./deviceQuery

如果能看到GPU信息输出,则表示安装成功。

Windows环境

Windows实例通常通过图形界面进行安装,较为直观。

  1. 远程桌面连接:连接到Windows实例。

  2. 下载驱动:访问驱动程序下载页面,根据您选择的机型的GPU型号(如Tesla T4、A10等,直接在搜索框中搜索关键字)和Windows Server版本选择驱动下载。

  3. 安装:双击下载的.exe文件,按照向导提示完成安装。

  4. 验证:打开命令提示符(cmd),输入nvidia-smi,查看驱动信息是否正常显示。

GRID驱动安装:如果您的GPU计算型实例需要OpenGL图形支持(如渲染、图形工作站),需要安装GRID驱动。

使用脚本自定义安装驱动和CUDA

方法一:使用金山云自动化脚本安装

金山云提供了自动化脚本,可以为基础标准镜像(CentOS & Ubuntu)安装最新的GPU驱动,省去了手动配置依赖的麻烦。

  1. 下载脚本:登录您的GPU实例,下载CUDA自动安装脚本到实例。

wget --referer=https://ks3-cn-beijing.ksyun.com/pang-important/auto_install_kingsoft.sh
  1. 执行脚本

# 运行脚本
sudo sh ./auto_install_kingsoft.sh

方法二:使用自定义数据

对于Linux环境,金山云提供的自动化脚本是自定义安装的基础。由于不同机型对驱动版本的要求不同,建议采用以下步骤进行定制:

  1. 准备脚本:获取金山云提供的CUDA自动安装脚本(Linux)。您也可自行准备脚本。

  2. 修改脚本内容(可选) :如果您需要安装特定版本的CUDA而非最新版,可以使用文本编辑器打开脚本。通常脚本中会包含下载链接的变量,您可以将其替换为指定版本的下载地址。

  3. 前往实例创建页:选择GPU实例。

  4. 在高级选项(选填)的自定义数据区域内,手动输入已准备的脚本内容。

  5. 按照页面提示,完成订单支付。

常见问题与注意事项

  • 驱动与CUDA版本匹配:并非所有驱动都支持所有CUDA版本。建议在安装CUDA Toolkit时,利用其自带的驱动,或者参考官方发布的CUDA Compatibility文档进行匹配。

  • 直通模式与vGPU:如果是直通模式的GPU云主机,安装GRID驱动时必须使用vDWS License进行激活。

  • 重启实例:部分驱动安装完成后可能需要重启实例才能生效,建议在生产环境操作前规划好维护窗口。

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈