最近更新时间:2024-08-13 15:09:48
如果您想要在GPU云服务器上进行GPU加速计算任务(例如科学计算或大规模并行计算等),则需要安装CUDA开发运行环境。CUDA提供了一整套工具和库,可以帮助您进行GPU加速的程序开发,以充分发挥NVIDIA GPU的计算潜力,提高计算性能和加速运行效率。本文为您介绍如何手动安装CUDA。
确保GPU实例的驱动版本与待安装的CUDA版本相匹配。更多信息,请参见CUDA Compatibility (nvidia.com)。
本文以CUDA 12.4.1版本为例,CentOS7.6操作系统为您介绍在GPU实例上安装CUDA的具体操作。
一、获取CUDA安装包
1.进入CUDA Toolkit Archive页面。
2.选择驱动对应的CUDA版本——CUDA Toolkit 12.4.1为例。
3.获取CUDA安装包下载地址。
a.选择需要的操作系统、架构或版本等参数项。
b.获取CUDA安装包下载地址。
二、安装CUDA包
1.使用wget命令,并粘贴步骤一获取的下载地址,然后执行命令下载CUDA安装包。
wget https://developer.download.nvidia.com/compute/cuda/12.4.1/local_installers/cuda_12.4.1_550.54.15_linux.run
2.依次执行以下命令,安装CUDA软件包。
对于GPU计算型实例,您可以单独手动安装Tesla驱动,也可以在安装CUDA时同步安装CUDA内自带的驱动。
a.交互式安装方式
sudo chmod +x cuda_12.4.1_550.54.15_linux.run
sudo ./cuda_12.4.1_550.54.15_linux.run
根据提示输入accept后,请依据实际情况选择是否安装CUDA包中自带的驱动:
如果您的实例为GPU计算型实例,并且该实例已安装了驱动,请按照下图操作(使用Enter键)取消Driver选项,然后选择Install继续安装。
重要:如果未取消Driver选项,则会安装CUDA包中自带的驱动来覆盖实例已安装的驱动。
如果您的实例为GPU计算型实例,并且您需要使用CUDA包中自带的驱动,则需要先确认CUDA包内的驱动与该实例的GPU型号是否兼容。确认CUDA包内的驱动与GPU型号兼容时,请保持默认选项(即已选中Driver选项)并选择Install继续安装。
b.静默安装方式
sudo chmod +x cuda_12.4.1_550.54.15_linux.run
sudo ./cuda_12.4.1_550.54.15_linux.run --toolkit --samples --silent
重要:采用静默安装方式,不会自动安装CUDA包自带的驱动,您需要手动单独安装GPU实例所需的驱动。
执行以下命令,重启GPU实例。
reboot
依次执行以下命令,配置CUDA环境变量。
echo 'export PATH=/usr/local/cuda/bin:$PATH' | sudo tee /etc/profile.d/cuda.sh
source /etc/profile
三、检查CUDA是否成功安装
1. 执行nvcc -V
命令,检查CUDA安装版本是否正确。
2.依次执行以下命令,测试CUDA Samples,验证CUDA是否安装成功。
cd /usr/local/cuda-12.4/extras/demo_suite
./deviceQuery
3.如果输出结果显示Result=PASS,则表示CUDA安装成功。
登录GPU实例,进行CUDA驱动下载
选择与自己的操作系统相匹配的安装包。以Windows Server 2016为例,可按如下方式进行选择:
运行下载好的程序,选择自定义安装
若提前手动安装了GPU驱动,安装cuda时可以不再安装GPU驱动。若没有安装过GPU驱动,则需要安装GPU驱动
建议直接安装cuda驱动的同时安装GPU驱动,防止手动安装的GPU驱动和Cuda不匹配
选择安装路径
配置系统环境变量
一般cuda安装完成会自动加入到系统环境变量中
如果提示nvcc或nvidia命令找不到,则手动配置nvidia-smi和nvcc的环境变量
打开Windows控制台命令窗口,输入nvcc -V,若出现以下结果,证明CUDA安装成功
纯净模式