当前位置:   article > 正文

ubuntu18.04 cuda11.7 cudnn11.x pytorch1.11.0_cuda 11.7对应的pytorch

cuda 11.7对应的pytorch

系统环境准备

这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本

查找系统对应的gcc与kernel版本
在这里插入图片描述

# 查看当前系统的gcc版本
$ gcc --version
# 若没有安装gcc,则执行以下命令
$ apt install gcc
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述

# 查看系统正在运行的Kernel Header
$ uname -r
# 执行系统更新后,为了确保Kernel Header和正在运行的Kernel相匹配,需要执行以下命令
$ sudo apt-get install linux-headers-$(uname -r)
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述

# 查看显卡信息,有显卡是安装cuda的前提
lspci | grep -i nvidia
  • 1
  • 2

在这里插入图片描述

安装NVIDIA显卡驱动

# 查看你可以使用的驱动
ubuntu-drivers devices
  • 1
  • 2
# 卸载Nouveau 在安装前,Nouveau可能已经启动,所以无法安装Nvidia成功
#---open a terminal---
sudo apt-get remove nvidia*
sudo apt autoremove
sudo apt-get install dkms build-essential linux-headers-generic
 
sudo vim /etc/modprobe.d/blacklist.conf
#---save the following info into file blacklist.conf---
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
#---end of the info saved----
 
#---go back to the terminal---
echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
sudo update-initramfs -u
reboot
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19

NVDIA driver search page搜索显卡需要的驱动型号并下载、安装

# 查看NVIDIA版本检验是否安装完成
nvidia-smi
  • 1
  • 2

在这里插入图片描述

搭建cuda11.3

其他版本:https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/cuda-downloads
在这里插入图片描述

wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run
sudo sh cuda_11.3.0_465.19.01_linux.run
  • 1
  • 2

选择continue
在这里插入图片描述
输入accept
在这里插入图片描述
不要选Driver,会覆盖之前安装的显卡
在这里插入图片描述
修改安装路径(可选,默认安装在/usr/local/cuda)
选择Options
在这里插入图片描述
选择Toolkit Options

需要提前建立好目录
/data/software/cuda_11_3
/data/software/cuda_11_3_samples
/data/software/cuda_11_3_samples/mylib
在这里插入图片描述
/usr这种非用户目录的都要去掉,然后change Toolkit Install Path
在这里插入图片描述
同理修改CUDA Samples
在这里插入图片描述

选择安装路径

确定路径后选择install即可

添加配置文件

vim ~/.bashrc
  • 1

默认添加如下配置

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

# 指定gpu序列号,看自己情况
export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

自定义路径添加如下配置

# >>> cuda initiallize >>>
export PATH="/data/software/cuda_11_3/bin:$PATH"
export LD_LIBRARY_PATH="/data/software/cuda_11_3/lib64:/data/software/cuda_11_3_samples/mylib/lib64:$LD_LIBRARY_PATH"

export CUDA_HOME=$CUDA_HOME:/data/software/cuda
export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
# <<< cuda initialize <<<

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

创建软连接映射
在这里插入图片描述

刷新配置

source ~/.bashrc
  • 1

查看版本

nvcc -V
  • 1

在这里插入图片描述

测试cuda安装是否成功

 /data/software/cuda/extras/demo_suite/deviceQuery
  • 1

如果没有第一步的环境准备kernel,会出现下面错误

./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 999
Result = FAIL
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

并且在使用pytorch时出现下图错误
在这里插入图片描述
正确的情况是下图

在这里插入图片描述

搭建cudnn11.x

https://developer.nvidia.com/rdp/cudnn-download

在这里插入图片描述

https://developer.nvidia.com/compute/cudnn/secure/8.4.0/local_installers/11.6/cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive.tar.xz
  • 1

解压

tar -xvf cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive.tar.xz
  • 1

将下载好的.h文件和lib文件放到cuda文件夹目录下

sudo cp cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive/include/cudnn*.h /data/software/cuda/include 

sudo cp -p cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive/lib/libcudnn* /data/software/cuda/lib64

sudo chmod a+r /data/software/cuda/include/cudnn*.h /data/software/cuda/lib64/libcudnn*

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

安装pytorch1.11.0

https://pytorch.org/get-started/previous-versions

在这里插入图片描述

conda install pytorch==1.11.0 torchvision==0.12.0 torchaudio==0.11.0 cudatoolkit=11.3 -c pytorch
  • 1

验证pytorch
在这里插入图片描述

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号