赞
踩
由于最近只能使用Windows系统训练神经网络,但是程序总是不调用GPU而拖慢了工作进度,因此踏上了配置环境的不归路,在此记录一下配置环境的真正流程和我遇到过的所有坑,希望对大家有所帮助。
根据要安装的tensorflow-gpu版本查看需要安装的CUDA和cudnn版本
例如,我需要安装的是tensorflow-gpu 1.14.0,因此需要安装CUDA10,和cuDNN7.4
可在这里查看:
NVIDIA驱动版本查看方式:开始菜单——>NVIDIA control panel——>系统信息
若显卡驱动不满足要求,则需要更新驱动版本,步骤如下:
(1)查看显卡型号:如上图所示(开始菜单——>NVIDIA control panel——>系统信息)
(2)在此处下载显卡型号对应的驱动版本。Windows驱动程序类型,也在上图系统信息里查看。最新栏里选择Studio驱动程序。下载后安装即可
(1)在此处选择需要的CUDA版本,下载并安装。(选择精简安装,取消勾选创建快捷方式)
若安装失败如下图原因:
则选择自定义安装,取消勾选Visual Studio Intergration后再进行安装
(3)验证CUDA是否安装成功
进入CUDA的安装路径,并复制此路径
进入cmd命令窗,切换到安装目录下,执行nvcc -V指令,如下图所示即安装成功
在这里下载cuDNN与CUDA对应的版本。(下载时需要自行注册和登录账户),下载后解压文件夹,cuDNN安装过程如下:
若cuda 安装目录:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0
(1)把 cudnn 解压包下的:cuda\bin\cudnn64_7.dll 复制到:cuda安装目录\bin
(2)把 cudnn 解压包下的:cuda\include\cudnn.h 复制到:cuda安装目录\include
(3)把 cudnn 解压包下的:cuda\lib\x64\cudnn.lib 复制到:cuda安装目录\lib\x64
说明:复制过程不会有重复文件需要覆盖,如果有,说明cuDNN下载的版本有问题,请自行检查,可在这里参考
为防止出现未知错误,cudnn安装完成后,把 3 个路径加入 环境变量\用户变量\path 中:
(1)C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin
(2)C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\include
(3)C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\lib\x64
控制面板——>系统——>高级系统设置
(2)验证cuDNN安装是否成功
进入下图路径,分别执行bandwidthTest.exe和deviceQuery.exe两个程序,如下图便是安装成功:
(1)打开Anaconda Prompt(conda -V命令可查看anaconda版本,conda info --envs命令可查看已存在的虚拟环境信息)
(2)创建虚拟环境
conda create -n env_name python=3.6 # env_name是自己命名的虚拟环境名
(3)进入虚拟环境
conda activate env_name
(4)安装tensorflow-gpu版本
此处千万不要安装tensorflow的cpu版本,不然程序默认调用cpu版本,安好后再卸载cpu版本会导致很多错误,我就是栽在这里重安装了好几次。
conda install tensoflow-gpu=1.14
在Anaconda Prompt中输入如下命令
>>> python
>>> import tensorflow as tf
>>> print(tf.__version__)
>>> print(tf.test.is_gpu_available())
若如下图所示,则tensorflow-gpu安装成功
报错原因:这是由于numpy1.19.1版本过高造成,需要降至1.16.0
解决办法:退出python程序,重新安装numpy1.16.0
>>> exit()
>>>pip install numpy==1.16
解决办法:
>>>pip install google-pasta==0.1.6
p36是刚刚配置好的虚拟环境的文件夹
至此我们配置好的tensorflow-gpu已关联到了当前项目
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。