赞
踩
因为是卸载重装,所以假设本文读者之前安装过。有不明白的欢迎交流。
有用链接
这个链接给了安装过程中的截图,而本文主要是命令行。
ubuntu 20.04 安装与卸载 Anaconda3 + CUDA 11.1 + cuDNN 8.0.5 + PyTorch 1.9.0_m0_52650517的博客-CSDN博客
查看Ubuntu版本
lsb_release -a
查看cuda driver和gpu驱动状态版本
nvidia-smi
查看cuda runtim版本 (runtim<=driver)
nvcc -v
查看进程 ps -aux
查看cpu top
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
卸载cuda
cd /usr/local/cuda/bin
./cuda-uninstaller
卸载pytorch(版本与cuda关联)
conda uninstall pytorch
pip uninstall torch 一定要删干净,删不干净的话,会发现还是原来的版本
pip uninstall torch # run this command twice
命令行不好下载就下载到本地,然后放到服务器
先全部选择好所有文件的对应版本!!!
注意安装顺序
下面下载下列版本:
#cuda 10.0 链接:https://developer.nvidia.com/cuda-toolkit-archive(早期版本) 命令: wget 下载链接 sudo sh cuda_10.0.130_410.48_linux.run 环境变量设置(有可能不用设置) vim ~/.bashrc export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64 export PATH=$PATH:/usr/local/cuda/bin export CUDA_HOME=$CUDA_HOME:/usr/local/cuda source ~/.bashrc #cudnn 7.6.5 for cuda10.0 https://developer.nvidia.com/rdp/cudnn-archive 安装: 命令: sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ sudo chmod a+r /usr/local/cuda/include/cudnn.h sudo chmod a+r /usr/local/cuda/lib64/libcudnn* #python2.7 conda create -n python27 python=2.7 #pytorch1.1.0 conda install pytorch==1.1.0 torchvision==0.3.0 cudatoolkit=10.0 -c pytorch
cuda和cudnn网址
Developer Downloads | NVIDIA Developer
安装cuda
sudo sh /home/admin10101/cuda_11.0.3_450.51.06_linux.run
命令窗口拉大一点,不然看不到下面的选项提示
【】是未选,【×】是被选中
Accept,去掉driver
环境变量
vim ~/.bashrc
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
source ~/.bashrc
Conda -version 查看conda是否安装成功
Cudnn安装
下载后解压NVIDIA cuDNN | NVIDIA Developer
tar -xzvf cudnn-10.2-linux-x64-v7.6.5.32.tgz
注意找到这个解压后的名字位置,解压后文件夹名字为cuda
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
pytorch安装
建议不用去官网了,因为下载不了
下载:
Index of /anaconda/cloud/pytorch/linux-64/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror
安装
Pytorch快速离线安装_Suan2014的博客-CSDN博客
这篇博客有个小错误,第一行命令行 不用-n
torch.cuda.is_available()
Torch.version.cuda如果发现还是原来的版本,一,没有卸载干净,二,环境变量
如果import torch报这种错误,说明你的环境是新装的
OSError: libmkl_intel_lp64.so: cannot open shared object file: No such file or directory
使用conda install numpy即可连带其他包一块出来了
nvcc -v会出错
应该 是 nvcc -V
如果你发现 nvcc版本明显不一致(比较低),可能是环境变量的问题。
vim ~/.bashrc 修改或添加环境变量
修改完,保存完之后别忘了source ~/.bashrc激活一下
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。