当前位置:   article > 正文

pytorch环境配置_pytorch环境变量

pytorch环境变量

由于在windows下环境配置问题比较多,尝试了在Linux下配置,记录一下。

一、基础环境

1. Linux(Ubuntu16.04)

计划安装在一个移动固态硬盘上,因此采用虚拟机的安装方式,安装时注意设置以下几点:

1)为了兼容原电脑的boot方式,选择uefi。

2)在vmware中设置系统在整个磁盘

3)并且保留对硬盘的操作,否则无法在linux系统中访问硬盘。

首次登录系统后,选择镜像源更新软件包。

  1. <strong>sudo apt-get update
  2. sudo apt-get upgrade
  3. sudo reboot</strong>

2. Cuda+Cudnn

走了两天的弯路告诉我,一定要先安装CUDA。因为Linux上NVIDIA驱动兼容性很差,很容易遇到无限登录问题。尝试了很多方法,最后采用以下的方式

理论上CUDA中包含显示驱动,只需安装CUDA不需要再单独安装驱动。但是由于未知原因我安装的CUDA启动以后总是无法识别驱动,所以我先安装了NVIDIA驱动,后安装CUDA。

2.1 显卡驱动(可选)

2.1.1下载驱动

首先登陆NVIDIA官网下载对应型号的驱动。https://www.nvidia.com/Download/index.aspx    dab格式bug很多,下载run格式

可使用命令查看硬件型号

<strong>sudo lshw -numeric -C display</strong>

使用命令查看推荐安装的驱动版本

<strong>ubuntu-drivers devices</strong>

2.1.2 屏蔽开源驱动nouveau

因为安装的时候NVIDIA驱动会自动停止其他驱动,保险起见加入黑名单。

打开黑名单

<strong>sudo gedit /etc/modprobe.d/blacklist.conf</strong>

添加以下内容

  1. <strong>blacklist nouveau
  2. blacklist vga16fb
  3. blacklist rivafb
  4. blacklist nvidiafb
  5. blacklist rivatv</strong>

添加完以后输入更新内核设置后重启

<strong>sudo update-initramfs –u</strong>

重启后显示字体会变大,这是禁用显卡驱动后的正常现象,不放心可以输入一下命令检查是否禁用成功

<strong>lsmod | grep nouveau</strong>

重启后如果字体没有变大,可以尝试强制删除

  1. <strong>mv /lib/modules/4.13.0-45-generic/kernel/drivers/gpu/drm/nouveau/nouveau.ko /lib/modules/4.13.0-45-generic/kernel/drivers/gpu/drm/nouveau/nouveau.ko.org
  2. update-initramfs -u</strong>

2.1.3 删除残留驱动(可选)

用于安装失败卸载重新安装

<strong>sudo apt-get remove --purge nvidia*</strong>

2.1.4 安装dkms包

如果不安装dkms包,安装过程中可能会报错:unable to locate the kernal sourse

输入命令安装

<strong>sudo apt install dkms</strong>

2.1.5 安装驱动

按Ctrl+Alt+F1进入控制台,先输入用户名和密码

驱动管理休眠

<strong>sudo service lightdm stop</strong>

cd到显卡驱动目录,执行

<strong>sudo bash NVIDIA*.run</strong>

接着按照提示进行安装,需要注意的是:安装过程中报错The distribution-provided pre-install script failed不用管继续安装。注意openl一定不要安装(除非双显卡),否则还是会出现无限登陆问题。其他按照提示选择,提示是否使用nvidia 的xconfig要选择替换,直至最终安装完成后唤醒驱动管理

<strong>sudo service lightdm start</strong>

2.1.6 重新启动

安装完成后输入命令重新启动系统

<strong>sudo reboot</strong>

重新启动后可以看到NVIDIA驱动已经安装完成(大多数人是这样)。笔者登陆时依然有循环登陆的问题,查阅了很多资料,试了很多,最终发现是UFEI安全模式导致的,所以如果系统的引导模式是UFEI可以尝试关掉安全模式。

安装完成后,可运行以下命令查看安装情况

  1. <strong>sudo apt install mesa-utils
  2. glxinfo|grep rendering
  3. nvidia-smi </strong>

 

 

2.2 CUDA

2.2.1 安装CUDA

有了安装NVIDIA驱动的经验,安装CUDA就不难。

 

Cuda Toolkit 安装地址为:https://developer.nvidia.com/cuda-downloads 同样下载 .run格式的。

 

与安装NVIDIA驱动相似,需要在管理驱动休眠的状态下安装。

2.2.2 安装第三方库

安装过程中,注意到提示缺少几个第三方库,按照说明文件(https://docs.nvidia.com/cuda/)进行安装。

  1. <strong>sudo apt-get install g++ freeglut3-dev build-essential libx11-dev \
  2. libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev</strong>

2.2.3 设置环境变量

如果没有安装vim包需要输入以下命令

<strong>sudo apt-get install vim</strong>

如果提示vim 依赖vim-common 可以先卸载vim-common再安装

<strong>sudo apt-get remove vim-common</strong>

打开环境变量配置文件

<strong>sudo vim  ~/.bashrc</strong>

按i键移动到末尾出增加以下两行

  1. <strong>export PATH=/usr/local/cuda-9.1/bin:$PATH
  2. export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64:$LD_LIBRARY_PATH</strong>

按ESC键盘 输入 :wq 保存退出

运行以下命令更新环境变量

<strong>source ~/.bashrc</strong>

完成后输入命令测试安装情况

<strong>nvcc --version</strong>

出现以下提示说明安装成功

测试cuda的Samples

  1. <strong>cd /usr/local/cuda-9.1/samples/1_Utilities/deviceQuery
  2. sudo make
  3. sudo ./deviceQuery</strong>

得到以下结果证明cuda安装成功

2.3 cuDNN

登录网站下载对应版本的cuDNN,需要登录NVIDIA帐号。https://developer.nvidia.com/rdp/cudnn-archive

下载完成后打开下载地址终端,运行以下命令安装

  1. <strong>sudo dpkg -i libcudnn7_7.0.5.15-1+cuda9.1_amd64.deb
  2. sudo dpkg -i libcudnn7-dev_7.0.5.15-1+cuda9.1_amd64.deb
  3. sudo dpkg -i libcudnn7-doc_7.0.5.15-1+cuda9.1_amd64.deb</strong>

安装完成后输入以下命令测试cuDNN

  1. <strong>cp -r /usr/src/cudnn_samples_v7/ $HOME
  2. cd $HOME/cudnn_samples_v7/mnistCUDNN
  3. make clean && make
  4. ./mnistCUDNN</strong>

得到以下结果,证明cuDNN安装成功

3. Anaconda

登录https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/镜像选择合适的下载版本进行下载

下载后运行命令安装

<strong>sudo sh Anaconda*.sh</strong>

4. PyCharm

采用PyCharm专业版,学生可免费申请 官方网址:https://www.jetbrains.com/pycharm/

下载后将文件放到需要安装的目录(建议放在home下),运行以下命令进行解压

<strong>sudo tar -xzf pycharm-professional-2018.1.4.tar.gz</strong>

解压后即可删除压缩包文件,然后进入bin文件夹使用sh命令运行PyCharm

<strong>sudo sh pycharm.sh</strong>

5. Python环境

5.1 镜像源加速

  1. <strong>conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
  2. conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  3. conda config --set show_channel_urls yes</strong>

5.2 建立基础python环境

  1. <strong>conda create -n base_env python=3.6
  2. source activate base_env
  3. conda install numpy
  4. conda install opencv
  5. conda install matplotlib
  6. conda install scipy
  7. conda install pandas</strong>

5.3 clone出使用的环境

clone出用于安装pytorch和tensorflow的env并激活环境

  1. <strong>conda create -n tensorflow --clone base_env
  2. source activate tensorflow</strong>

5.4 Pytorch

进入PyTorch官网(https://pytorch.org/)选择对应的版本 并按照提示命令输入到命令符中,选择Linux+conda+3.6+9.1时需要输入以下命令

<strong>conda install pytorch torchvision cuda91 -c pytorch</strong>

5.5 TensorFlow

许多项目会用到TensorFlow的库,也一并装上,官网地址:https://www.tensorflow.org/ 根据安装需求查找安装的命令,在Linux+Anaconda+gpu需要输入以下命令

<strong>pip install --ignore-installed --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.6.0-cp36-cp36m-linux_x86_64.whl</strong>
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/591555
推荐阅读
相关标签
  

闽ICP备14008679号