当前位置:   article > 正文

linux卸载重新安装cuda,cudnn和pytorch的误区和相关常用命令_删除了cuda环境变量还是指向cuda文件

删除了cuda环境变量还是指向cuda文件

因为是卸载重装,所以假设本文读者之前安装过。有不明白的欢迎交流。

有用链接
这个链接给了安装过程中的截图,而本文主要是命令行。
ubuntu 20.04 安装与卸载 Anaconda3 + CUDA 11.1 + cuDNN 8.0.5 + PyTorch 1.9.0_m0_52650517的博客-CSDN博客

查看Ubuntu版本
lsb_release -a
查看cuda driver和gpu驱动状态版本
nvidia-smi
查看cuda runtim版本 (runtim<=driver)
nvcc -v
查看进程 ps -aux
查看cpu top

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

卸载cuda

cd /usr/local/cuda/bin
./cuda-uninstaller
  • 1
  • 2

卸载pytorch(版本与cuda关联)

conda uninstall pytorch
pip uninstall torch 一定要删干净,删不干净的话,会发现还是原来的版本
pip uninstall torch # run this command twice
  • 1
  • 2
  • 3

命令行不好下载就下载到本地,然后放到服务器
先全部选择好所有文件的对应版本!!!

注意安装顺序

下面下载下列版本:

#cuda 10.0
链接:https://developer.nvidia.com/cuda-toolkit-archive(早期版本)

命令:
wget 下载链接
sudo sh cuda_10.0.130_410.48_linux.run

环境变量设置(有可能不用设置)
vim ~/.bashrc
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
source ~/.bashrc

#cudnn 7.6.5 for cuda10.0
https://developer.nvidia.com/rdp/cudnn-archive
安装:
命令:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

#python2.7
conda create -n python27 python=2.7

#pytorch1.1.0
conda install pytorch==1.1.0 torchvision==0.3.0 cudatoolkit=10.0 -c pytorch


  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30

cuda和cudnn网址
Developer Downloads | NVIDIA Developer

安装cuda
sudo sh /home/admin10101/cuda_11.0.3_450.51.06_linux.run
命令窗口拉大一点,不然看不到下面的选项提示
【】是未选,【×】是被选中
Accept,去掉driver
环境变量

vim ~/.bashrc
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
source ~/.bashrc
  • 1
  • 2
  • 3
  • 4
  • 5

Conda -version 查看conda是否安装成功

Cudnn安装
下载后解压NVIDIA cuDNN | NVIDIA Developer
tar -xzvf cudnn-10.2-linux-x64-v7.6.5.32.tgz
注意找到这个解压后的名字位置,解压后文件夹名字为cuda

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
  • 1
  • 2
  • 3
  • 4

pytorch安装
建议不用去官网了,因为下载不了
下载:
Index of /anaconda/cloud/pytorch/linux-64/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror
安装
Pytorch快速离线安装_Suan2014的博客-CSDN博客
这篇博客有个小错误,第一行命令行 不用-n
torch.cuda.is_available()
Torch.version.cuda如果发现还是原来的版本,一,没有卸载干净,二,环境变量

如果import torch报这种错误,说明你的环境是新装的
OSError: libmkl_intel_lp64.so: cannot open shared object file: No such file or directory
使用conda install numpy即可连带其他包一块出来了

nvcc -v会出错
应该 是 nvcc -V

如果你发现 nvcc版本明显不一致(比较低),可能是环境变量的问题。
vim ~/.bashrc 修改或添加环境变量
修改完,保存完之后别忘了source ~/.bashrc激活一下

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号