【Ubuntu2404】Ubuntu24.04安装NVIDIA驱动/CUDA/cuDNN搭建神经网络训练环境
Ubuntu24.04安装NVIDIA驱动/CUDA/cuDNN搭建神经网络训练环境
- 引言
- 一、安装NVIDIA驱动
- 1.1 从系统工具中安装
- 1.2 检验是否按安装成功
- 二、安装CUDA
- 2.1 通过apt-get安装CUDA
- 2.2 检验是否按安装成功
- 三、安装cuDNN
- 3.1 查看CUDA版本
- 3.2 下载并安装cuDNN
- 3.3 检验cuDNN是否安装成功
引言
NVIDIA 驱动
、CUDA
和 cuDNN
是紧密相关但各自具有独特功能的技术,它们共同为图形处理单元(GPU)加速的应用程序提供了强大的支持。本文主要介绍如何安装 NVIDIA
驱动、CUDA
及 cuDNN
,为后续神经网络训练提供支持。本文主要介绍Ubuntu24.04安装NVIDIA驱动、CUDA和cuDNN的流程。
另外需要说明的是,仅 NVIDIA
系列显卡支持,如需查看本机显卡情况,可以使用如下命令:
lspci | grep -i nvidia
charleswyq@charleswyq-ThinkBook-16p-G5-IRX:~$ lspci | grep -i nvidia
01:00.0 VGA compatible controller: NVIDIA Corporation AD107M [GeForce RTX 4060 Max-Q / Mobile] (rev a1)
01:00.1 Audio device: NVIDIA Corporation Device 22be (rev a1)
一、安装NVIDIA驱动
NVIDIA驱动使得操作系统和应用程序能够与 NVIDIA GPU
进行通信。驱动程序包含了GPU的硬件抽象层,通过它操作系统可以管理和分配GPU资源,如显存和计算核心。对于使用 NVIDIA
显卡的系统来说,安装正确的驱动是确保图形显示正常以及利用GPU加速计算能力的关键。
1.1 从系统工具中安装
由于Ubuntu24.04对 NVIDIA
有相关支持,可以从 软件和更新
- 附加驱动
中安装。
重要提醒:不建议从官网上下载手动安装,否则可能会无法使用,导致 nvidia-smi
命令报错。变更回来会更加麻烦,可能导致根本无法使用最后重装系统(血的教训)。
1.2 检验是否按安装成功
在终端中输入如下命令检验安装情况:
nvidia-smi
如果出现上图内容说明已经安装成功,一般来说使用系统工具进行安装就不会出错。
另外需要记下本机的 CUDA
版本,表格中右上角就是,后续安装cuDNN时需要使用。
Driver Version: 550.120
CUDA Version: 12.4
二、安装CUDA
CUDA
是由 NVIDIA
开发的一个并行计算平台和应用编程接口(API),它允许开发者编写能够在 NVIDIA GPU
上执行的代码。CUDA
支持 C、C++ 和 Fortran 等多种编程语言,并提供了一套丰富的库来简化开发过程。通过 CUDA
,开发者可以充分利用 GPU 中大量的并行处理单元来进行高性能计算任务,例如机器学习、图像处理、科学模拟等。CUDA
还包括了调试工具、性能分析器和其他辅助工具,帮助开发者优化他们的应用程序。
重要提醒:这里同样不建议手动下载安装,原因同上。 CUDA
安装失败比 NVIDIA Driver
更难处理。
2.1 通过apt-get安装CUDA
打开终端,直接通过 apt-get
进行安装。
sudo apt-get install nvidia-cuda-toolkit
2.2 检验是否按安装成功
在终端中输入如下命令检验安装情况:
nvcc -V
如果出现上图内容说明已经安装成功,一般来说使用 apt-get
进行安装就不会出错。
三、安装cuDNN
cuDNN
是一个专门针对深度神经网络(DNN)优化的库,它构建在 CUDA
之上。cuDNN
提供了高度优化的原语(primitives),用于实现常见的深度学习操作,如卷积、池化、激活函数等。这些原语经过精心设计,以最大限度地提高性能并减少内存占用,从而加速深度学习模型的训练和推理过程。cuDNN
支持流行的深度学习框架,如 TensorFlow、PyTorch 和 MXNet,因此开发者可以直接集成 cuDNN
来提升其模型的运行效率。
3.1 查看CUDA版本
在终端中输入如下命令查看 CUDA
版本,如果无法运行说明 NVIDIA
驱动安装错误,请完整卸载后重新安装。
nvidia-smi
如表中右上角所示, CUDA
版本为 12.4
。
CUDA Version: 12.4
3.2 下载并安装cuDNN
下载链接:cuDNN (官网)
这里推荐从官网下载并安装 cuDNN
。进入官网后,根据自己的需要选择合适版本的 cuDNN
。
根据官网中所示代码进行在线安装。
wget https://developer.download.nvidia.com/compute/cudnn/9.6.0/local_installers/cudnn-local-repo-ubuntu2404-9.6.0_1.0-1_amd64.deb
sudo dpkg -i cudnn-local-repo-ubuntu2404-9.6.0_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2404-9.6.0/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn
整个下载及安装过程还是比较迅速的。
3.3 检验cuDNN是否安装成功
注:需要安装
PyTorch
打开终端,并启用 Python
:
python
在 Python
环境中输入如下程序:
from torch.backends import cudnn
cudnn.is_available()
如返回 True 则说明cuDNN能够使用。