最近更新时间:2026-03-31 12:01:49
在GPU实例中安装驱动是启用GPU计算能力的关键步骤。本文将介绍金山云GPU实例的预装镜像、CUDA版本与机型的匹配建议,以及驱动安装的具体方法。
安装方法 | 说明 |
预装CUDA版本的公共镜像 | 创建GPU实例时,选择预装了CUDA的公共镜像(推荐CUDA 12.x及以上版本) |
手动安装 | 创建GPU实例后,手动安装驱动 |
脚本安装 | 创建GPU实例时,在高级设置-自定义数据区域输入自动安装脚本来安装驱动 |
金山云为GPU云服务器提供了预装CUDA驱动和开发工具包的标准镜像,可以显著简化部署流程。根据镜像列表,目前支持以下预装CUDA的镜像:
机型 | 公共镜像 | CUDA版本 | 驱动版本 | cuDNN版本 |
GPU推理Ⅱ型GN6I GPU通用计算型P4V GPU高效计算型P6V GPU通用计算型GN7I GPU通用计算型GN8I | CentOS-7.9 CUDA12.4 Ubuntu-22.04 CUDA12.4 | 12.4.131 | 550.127.08 | 9.2.0 |
GPU推理Ⅱ型GN6I | CentOS-7.6 CUDA10.2 Ubuntu-18.04 CUDA10.2 | 10.2.89 | 440.33.01 | 7.6.5 |
GPU推理Ⅱ型GN6I | CentOS-7.3 CUDA8.0 CentOS-7.2 CUDA8.0 Ubuntu-16.04 CUDA8.0 | 8.0.61 | -- | -- |
GPU推理Ⅱ型GN6I | Centos-7.3 CUDA9.1 Centos-7.2 CUDA9.1 Ubuntu-16.04 CUDA9.1 | 9.1.85 | -- | -- |
选择合适的CUDA版本主要取决于您的GPU机型和应用程序框架的需求。以下是通用的选择建议:
新购机型(如GN7I、GN8I、P6V等) :建议选择 CUDA 12.x 版本。较新的GPU架构对CUDA 12有更好的优化和支持,同时主流AI框架的最新版本也多基于CUDA 12进行编译。
旧版机型或特定环境:如果您使用的是较早的GPU型号(如P4V),或者需要运行特定的旧版软件,可能需要选择 CUDA 11.x 或更早版本。此时可以选择标准镜像(不含CUDA)自行安装指定版本,以确保兼容性。
注意:如果您需要vGPU功能(将一块GPU分割成多个虚拟GPU),则必须安装GRID驱动,并配合对应的License使用(如vDWS、vPC、vCS)。
根据操作系统的不同,安装方式有所区别。以下介绍在Linux和Windows环境下的安装方法。
机型 | 显卡 |
GPU高效计算型P6V | A800 |
GPU通用计算型P4V | Tesla V100 |
GPU通用计算型GN7I | A10 |
GPU通用计算型GN81 | RTX 4090 |
GPU推理II型GN6I | Tesla T4 |
如果您需要安装特定版本的CUDA,可以前往官网下载。
下载Runfile:访问CUDA下载页面,选择对应的操作系统架构,推荐下载 runfile (local) 类型的安装包。
安装驱动和CUDA:
# 添加执行权限并运行
sudo sh cuda_版本号_linux.run配置环境变量:安装完成后,建议将CUDA路径添加到~/.bashrc中:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source ~/.bashrc验证安装:
# 查看驱动版本
nvidia-smi
# 编译并运行示例程序
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
make
./deviceQuery如果能看到GPU信息输出,则表示安装成功。
Windows实例通常通过图形界面进行安装,较为直观。
远程桌面连接:连接到Windows实例。
下载驱动:访问驱动程序下载页面,根据您选择的机型的GPU型号(如Tesla T4、A10等,直接在搜索框中搜索关键字)和Windows Server版本选择驱动下载。
安装:双击下载的.exe文件,按照向导提示完成安装。
验证:打开命令提示符(cmd),输入nvidia-smi,查看驱动信息是否正常显示。
GRID驱动安装:如果您的GPU计算型实例需要OpenGL图形支持(如渲染、图形工作站),需要安装GRID驱动。
金山云提供了自动化脚本,可以为基础标准镜像(CentOS & Ubuntu)安装最新的GPU驱动,省去了手动配置依赖的麻烦。
下载脚本:登录您的GPU实例,下载CUDA自动安装脚本到实例。
wget --referer=https://ks3-cn-beijing.ksyun.com/pang-important/auto_install_kingsoft.sh执行脚本:
# 运行脚本
sudo sh ./auto_install_kingsoft.sh对于Linux环境,金山云提供的自动化脚本是自定义安装的基础。由于不同机型对驱动版本的要求不同,建议采用以下步骤进行定制:
准备脚本:获取金山云提供的CUDA自动安装脚本(Linux)。您也可自行准备脚本。
修改脚本内容(可选) :如果您需要安装特定版本的CUDA而非最新版,可以使用文本编辑器打开脚本。通常脚本中会包含下载链接的变量,您可以将其替换为指定版本的下载地址。
前往实例创建页:选择GPU实例。
在高级选项(选填)的自定义数据区域内,手动输入已准备的脚本内容。
按照页面提示,完成订单支付。
驱动与CUDA版本匹配:并非所有驱动都支持所有CUDA版本。建议在安装CUDA Toolkit时,利用其自带的驱动,或者参考官方发布的CUDA Compatibility文档进行匹配。
直通模式与vGPU:如果是直通模式的GPU云主机,安装GRID驱动时必须使用vDWS License进行激活。
重启实例:部分驱动安装完成后可能需要重启实例才能生效,建议在生产环境操作前规划好维护窗口。
纯净模式
