Ubuntu20.04安装NVIDIA显卡驱动、CUDA Toolkit、cuDNN步骤
- 安装前准备
- ️ 安装NVIDIA显卡驱动
- 方法一:使用系统仓库安装 (推荐)
- 方法二:使用官方.run文件安装(未使用不做说明)
- 安装CUDA Toolkit
- 1. 下载CUDA(后期增加:建议安装12.6的版本)
- 2. 安装CUDA
- 3. 配置环境变量
- 4. 验证CUDA安装
- 安装cuDNN (可选)
- 重要提醒
- 卸载CUDA
在Ubuntu 20.04上安装NVIDIA驱动和CUDA对于深度学习、科学计算或图形处理等工作非常重要。
(安装在基础环境(the base environment)下)
安装前准备
开始之前,建议先完成以下准备工作:
- 更新系统:在终端中执行
sudo apt update && sudo apt upgrade -y
来更新你的系统软件包列表和已安装的包。 - 确认GPU型号:在终端输入
lspci | grep -i nvidia
来确认显卡是NVIDIA品牌且型号符合安装要求。
️ 安装NVIDIA显卡驱动
安装方法 | 优点 | 缺点 | 适用人群 |
---|---|---|---|
使用系统仓库 (推荐) | 简单快捷,通过几条命令即可安装;系统自动管理兼容性。 | 可能不是最新的驱动版本。 | 新手用户,希望快速完成安装。 |
使用官方.run文件 | 可以安装特定版本的驱动。 | 步骤相对繁琐;需要禁用默认驱动并关闭图形界面。 | 需要特定版本驱动的进阶用户。 |
方法一:使用系统仓库安装 (推荐)
查看推荐驱动:在终端中输入
ubuntu-drivers devices
,系统会列出推荐的驱动版本。安装驱动:可以直接安装所有推荐驱动
sudo ubuntu-drivers autoinstall
,或安装指定版本(如版本570)sudo apt install nvidia-driver-570
。重启系统:安装完成后,务必重启电脑
sudo reboot
。验证安装:重启后,在终端输入
nvidia-smi
。如果显示出GPU的信息表格,则说明驱动安装成功。
方法二:使用官方.run文件安装(未使用不做说明)
安装CUDA Toolkit
1. 下载CUDA(后期增加:建议安装12.6的版本)
访问 NVIDIA CUDA Toolkit Archive,根据需要和驱动支持情况,选择一个合适的CUDA版本。推荐使用.run
文件方式安装,因为它提供了更多的自定义选项。
2. 安装CUDA
- 运行安装命令:
wget https://developer.download.nvidia.com/compute/cuda/12.6.2/local_installers/cuda_12.6.2_560.35.03_linux.run
sudo sh cuda_12.6.2_560.35.03_linux.run
- 在安装界面:
- 输入
accept
同意许可协议。 - 关键步骤:由于已经提前安装好了NVIDIA驱动,在此处需要取消勾选(按空格键)驱动(Driver)的安装,只安装CUDA Toolkit。
- 输入
3. 配置环境变量
编辑用户环境配置文件:
sudo vim ~/.bashrc
(也可使用gedit
或nano
)。在文件末尾添加以下内容:
export PATH=/usr/local/cuda-12.6/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-12.6/lib64:$LD_LIBRARY_PATH
使配置立即生效:
source ~/.bashrc
。
4. 验证CUDA安装
在终端中输入 nvcc -V
。如果该命令能够输出安装的CUDA版本信息,表示CUDA安装成功。
安装cuDNN (可选)
如果需要进行深度学习开发,通常还需要安装NVIDIA cuDNN库。
- 下载:访问 NVIDIA cuDNN下载页面,登录后下载与已安装CUDA版本对应的cuDNN Library for Linux压缩包(如
.tar.xz
格式)。
- 安装:
- 解压下载的文件
- 将解压出的文件复制到CUDA安装目录
tar -xvf cudnn-linux-x86_64-9.9.0.52_cuda12-archive.tar.xz
sudo cp cudnn-linux-x86_64-9.9.0.52_cuda12-archive/include/cudnn*.h /usr/local/cuda-12.6/include
sudo cp -P cudnn-linux-x86_64-9.9.0.52_cuda12-archive/lib/libcudnn* /usr/local/cuda-12.6/lib64
sudo chmod a+r /usr/local/cuda-12.6/include/cudnn*.h /usr/local/cuda-12.6/lib64/libcudnn*
重要提醒
- 版本兼容性:在选择CUDA版本时,务必确保其与已安装的NVIDIA驱动兼容。可以通过
nvidia-smi
命令输出上方的 “CUDA Version” 来了解驱动支持的最高CUDA版本,安装的CUDA版本不应超过此版本。 - 多版本CUDA管理:如果你需要在系统中安装多个版本的CUDA,在安装时可以不创建
/usr/local/cuda
软链接,而是通过修改~/.bashrc
文件中的路径来灵活切换使用的CUDA版本。 - 处理依赖问题:在安装过程中如果遇到依赖缺失的问题,可以根据终端提示使用
apt
命令安装相应的依赖库。
卸载CUDA
通过 runfile 卸载
对于使用runfile安装的CUDA,需要使用其自带的卸载脚本。
cd /usr/local/cuda-12.6/bin
sudo ./cuda-uninstaller
运行脚本后,根据提示完成卸载 。完成后,可以手动删除残留的安装目录:
sudo rm -rf /usr/local/cuda-12.6