# 1. 查看系统是否可以识别到 NVIDIA 显卡
lspci |grep -i nvidia
# 2. 安装内核文件确保和内核版本一致
yum install kernel-devel kernel-headers
yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
# 3. 安装并查看 gcc 版本
yum groupinstall "Development Tools"
yum install gcc
gcc --version
# 4. 禁用 nouveau 驱动
vim /etc/default/grub
"GRUB_CMDLINE_LINUX" 中添加 rd.driver.blacklist=nouveau nouveau.modeset=0
重建 grub 配置
UEFI 引导执行如下操作:
grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
echo "blacklist nouveau" > /etc/modprobe.d/nvidia-default.conf
Legacy 引导执行如下操作:
grub2-mkconfig -o /boot/grub2/grub.cfg
echo "blacklist nouveau" > /etc/modprobe.d/nvidia-default.conf
# 5. 备份
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r)-nouveau.img
dracut /boot/initramfs-$(uname -r).img $(uname -r)
# 6. 重启验证 nouveau 是否被禁用
reboot
lsmod |grep nouveau
# 7. 安装 CUDA(可以采用 RPM 或 RUN 脚本方式进行安装,推荐使用 RUN 脚本)
CUDA 下载地址: https://developer.nvidia.com/cuda-downloads
RPM 方式:
rpm --install cuda-repo-<distro>-<version>.<architecture>.rpm
yum clean all
yum install cuda
Run 方式:
sh cuda_ <version> _linux.run
如果提示 gcc 版本不匹配,请覆盖以绕过它。
安装程序将提示以下内容:
EULA Acceptance
CUDA Driver 安装 - > NO
CUDA Toolkit 安装,位置和 /usr/local/cuda 符号链接
CUDA 示例安装和位置
# 8. 环境变量
编辑 .bash_profile 或 /etc/environment
export PATH=/usr/local/cuda-<version>/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-<version>/lib64:$LD_LIBRARY_PATH
# 9. 验证 CUDA
nvcc -V
cd /root/NVIDIA_CUDA-<version>_Samples/1_/drivers/
make
./deviceQuery
出现 PASS 则表示 CUDA 没有问题
# 10. 驱动安装(如果需要安装 CUDA 的话先安装 CUDA 再安装驱动,只安装驱动的话直接操作)
驱动下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn
init 3
sh NVIDIA*.run --no-opengl-files
DKSM 选 “no”
重写 X config 时 选 "no"
出现 unable to find the kernel source tree for the currently running kernel......... 执行如下操作:
sh NVIDIA*.run --no-opengl-files --kernel-source-path=/usr/src/kernels/内核号
出现 nable to load the kernel module 'nvidia.ko' 执行如下操作:
sh NVIDIA*.run --no-opengl-files --kernel-source-path=/usr/src/kernels/内核号 -k $(uname -r)
# 11. 检查
nvidia-smi
# 12. 重启
reboot
# 13. 安装 CUDNN(可选)
CUDNN 下载地址:https://developer.nvidia.com/rdp/cudnn-archive
CUDNN 需要和 CUDA 同版本
CUDNN 作为 CUDA 的补充,安装简单多了,只需要把下载后的压缩文件解压缩(如果下载的文件不是 tar.gz 需要修改为 tar.gz),分别将 cuda/include、cuda/lib、cuda/bin 三个目录中的内容拷贝到 CUDA 对应的目录中去即可
CUDA 和驱动安装操作文档:https://access.redhat.com/solutions/1453633