赞
踩
记录一下自己配置GPU的全过程及遇到的问题,若有错误请指正。
在官网下载和自己电脑匹配的版本:https://www.anaconda.com/download
可以skip registration 然后跳转到这里
双击打开刚才下载的文件
第一页 next
第二页 I agree
第三页 选择All Users
第四页 选择安装目录,这里最好记住这个目录,之后会用到,我选择安装在D盘
第五页 勾选选项,我这里是都选了,这个可以按照自己喜好
最后就可以install了,安装完成后会有提示“installation complete”,然后再点next。
打开电脑-系统属性-高级-环境变量
选择【系统变量】-【Path】,点击编辑,将以下几个文件夹添加进去,路径就是刚才说要记下来的安装目录
打开cmd,输入:
python
然后再重新打开cmd,输入:查询conda信息
conda info
如图,这样就是安装成功。
如果提示conda不是内部或外部命令,就是环境变量没有配置成功。
点击安装好的Anaconda Navigator,成功进入界面就是安装成功了。
conda create --name TensorFlow python=3.9
运行后会自动安装一些基础的包。
conda env list
可以看到已经成功创建TensorFlow:
激活TensorFlow,并输入conda list后可以看到此虚拟环境下已经安装的包:
activate TensorFlow
conda list
3. conda的一些其他命令:
conda install XXX:安装 XXX 包
conda remove XXX:删除XXX 包
conda env list:列出所有环境
activate noti(或 source activate noti):启用/激活环境
conda env remove -n noti:删除指定环境
deactivate(或source deactivate):退出环境
nvidia-smi
可以看到右上角:CUDA Version:12.3,表示我们最高可以安装的CUDA版本为12.3
通过配置名为TensorFlow的虚拟环境,我们已经安装了python,版本为3.9。
接下来就是安装互相匹配的PyTorch、CUDA、CUDNN。我这里用到的是:
PyTorch 11.8
CUDA 11.2
CUDNN 8.9
TensorFlow-gpu 2.10.0
参考Tensorflow官网https://tensorflow.google.cn/install/source_windows,
查看CPU和GPU的匹配信息:
打开网页:https://developer.nvidia.com/cuda-toolkit-archive,下载对应版本:
选择CUDA 11.2,windows,version 10
(我的电脑趁我不注意偷偷升到了WINDOWS11,但是安装version10目前看来是没问题。。)
下载好后打开安装程序,按照步骤安装,这里不再赘述。
【注意要记住CUDA的安装路径,之后要用到】
在cmd中输入以下代码,查看是否安装成功:
nvcc -V
这样就是安装成功。
也可以查看环境变量:
①是否有变量CUDA_PATH和CUDA_PATH_V11_2(不同版本V后数字不同),并检查路径是否正确。若没有则添加两变量并添加正确路径;若错误则修改成正确路径(路径为选项,自定义安装位置时选择的路径)
②系统变量中的Path是否有v11.2\bin,若没有则添加正确路径;若错误则修改成正确路径(路径为选项,自定义安装位置时选择的路径)
(我之前安装过12.2和12.3,所以有多个PATH)
打开网页:https://developer.nvidia.com/rdp/cudnn-archive,下载对应版本的CUDNN。
我这里选择的是8.9.7 for CUDA 11.X
选择local installer for windows:
下载后解压文件夹,可以看到三个文件夹:
同时打开CUDA的安装路径,忘记了就搜NVIDIA GPU Computing Toolkit文件夹,
可以看到同样名称的三个文件夹:
将CUDNN文件夹中的bin、lib、include文件夹中的文件复制到CUDA中对应的文件夹中
【注意是复制粘贴,不是替换!】
打开C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\demo_suite,查看是否有文件bandwidthTest.exe以及deviceQuery.exe,若存在则在该文件中打开cmd运行
运行deviceQuery.exe,得到如下结果:
运行bandwidthTest.exe,得到如下结果:
则说明CUDNN安装成功。
打开Anaconda Prompt,激活刚才创建的虚拟环境TensorFlow,输入:
pip install tensorflow-gpu==2.10
等待安装完成后,重启电脑。
打开pycharm,配置解释器,运行以下代码:
import tensorflow as tf
gpus = tf.config.experimental.list_physical_devices(device_type='GPU')
cpus = tf.config.experimental.list_physical_devices(device_type='CPU')
print(gpus, cpus)
若结果为:
[PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')] [PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU')]
则正确。
或者运行以下代码:
import tensorflow as tf
version=tf.__version__ #输出tensorflow版本
gpu_ok=tf.test.is_gpu_available() #输出gpu可否使用(True/False)
print("tf version:",version,"\nuse GPU:",gpu_ok)
若结果为:
则正确。
tf version: 2.10.0
use GPU: True
打开网页https://pytorch.org/get-started/locally/,选择对应版本,我的CUDA是11.2,可以选择11.8版本进行安装。
安装时有两个方法
方法一:在Pycharm中,打开terminal,复制粘贴代码:
这里有一个OSError,在代码后面加上–user可以安装成功,即:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 --user
方法二:看其他博主以管理员身份运行Anaconda Prompt,复制粘贴代码就可以安装成功,但我试了一下还是有OSError,所以还是得在后面加–user。
最后一行显示successfully installed即可。
import torch
print(torch.__version__)
print(torch.version.cuda)
print(torch.cuda.is_available()) #输出为True,则安装无误
若torch.cuda.is_available() 为True则GPU可用,False表示不可用。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。