赞
踩
a.在终端输入命令行(ctrl+alt+T快捷进入终端):
$ lspci | grep -i nvidia
查看电脑GPU信息如下:
b.在终端输入命令行:
$ uname -m && cat /etc/*release
验证自己的Linux系统是否支持CUDA:
Ubuntu16.04支持,系统信息如下:
c.在终端输入命令行:
gcc --version
如果显示未安装,则使用如下命令行进行安装:
sudo apt-get install build-essential
d .在终端输入:
$ uname -r
e.进一步在终端输入:
$ sudo apt-get install linux-headers-$(uname -r)
可以安装对应 kernel 版本的 kernel header 和 package development
若以上各项检查均满足要求,便可以进行下面的正式安装过程!
步骤如下:
a. 从NVIDIA驱动官网查找电脑的显卡型号然后下载相应的驱动,然后把下载好的文件移动到Home文件夹下,便于后续终端的操作,因为终端默认在Home文件夹下开启,我的电脑型号和驱动信息如下:
b. 禁止集成的 nouveau驱动:ubuntu系统集成显卡的驱动程序是nouveau,它是第三方为NVIDIA开发的开源驱动,我们需要先将其屏蔽才能安装NVIDIA官方驱动。将驱动添加到黑名单blacklist.conf中,但是由于该文件属性不允许修改,所以需要先修改文件属性。
修改属性命令:
$ sudo chmod 666 /etc/modprobe.d/blacklist.conf
用 gedit编辑器 打开 blacklist.conf
sudo gedit /etc/modprobe.d/blacklist.conf
在该文件后添加几行:
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb
保存退出文档编辑器
执行如下命令,更新系统,来禁用 nouveau
sudo update-initramfs -u
重启电脑,命令如下:
sudo reboot
重启成功后,在终端输入如下命令检查是否禁用 nouveau 成功,无输出,表示成功。这里强调必须是无任何输出才算成功;有的博客里采用其他方法禁用 nouveau,本人尝试后发现不能起到禁用效果,这里只给出对应链接,不做进一步展示;而对于笔者介绍的方法,如果不能起到禁用效果,则可以参考这篇博客,由于本人没有遇到这个问题,希望遇到问题的同学可以借鉴。
c. 按 ctrl+alt+f1 进入文本命令行界面
(按 ctrl + alt + f7 退出界面,进入界面之后先登录,login是指ubuntu系统的用户名,password是指用户名对应的密码,如果密码中有数字,不要使用数字小键盘进行输入,不然会显示密码错误!)
进入命令行后,执行以下命令,关闭图形界面(不执行后面会出错):
sudo service lightdm stop
卸载掉原有驱动:
(若安装过其他版本或其他方式安装过驱动执行此项)
sudo apt-get remove nvidia-*
给驱动 run 文件赋予执行权限:
sudo chmod a+x NVIDIA-Linux-x86_64-450.80.02.run
安装:
sudo ./NVIDIA-Linux-x86_64-450.80.02.run -no-opengl-files
只有禁用 opengl 这样安装才不会出现循环登录的问题
也有执行如下操作的:
sudo ./NVIDIA-Linux-x86_64-450.80.02.run -no-x-check -no-nouveau-check -no-opengl-files
但是可能会出错,需要具体情况具体分析;
# 说明
-no-x-check:安装驱动时关闭X服务
-no-nouveau-check:安装驱动时禁用nouveau
-no-opengl-files:只安装驱动文件,不安装OpenGL文件
安装过程中的选项:
由于本人在使用该方案时出现了错误,因此后面的安装经验转自这篇博客,此外,本人的报错情况如下图,因此就换了接下来的第二种安装方案;
a.禁止集成的 nouveau 驱动,方法同方案一,不再赘述。
b.卸载旧的驱动并添加源
sudo apt-get remove --purge nvidia-*
添加源:
sudo add-apt-repository ppa:graphics-drivers/ppa
按 enter 键添加;
更新源:
sudo apt-get update
寻找合适的驱动版本:
ubuntu-drivers devices
安装 NVIDIA driver
如上图显示 GTX1060显卡 建议的驱动版本是 430
c.按 ctrl+alt+f1 进入命令行界面
在命令行界面下输入如下命令,关闭图形界面,不执行后面会出错:
sudo service lightdm stop
卸载掉原有的驱动:
sudo apt-get remove nvidia-*
d. 安装并重新启动图形环境
sudo apt-get install nvidia-430
重新启动图形环境:
sudo service lightdm start
重启电脑:
sudo reboot
e.查看是否安装成功:
nvidia-smi
若安装成功,则如下图所示:
见博客:系统安装驱动
不推荐使用,因为只能安装最新版的驱动。
至此,NVIDIA独立显卡驱动安装完毕!
a.官网下载cuda9.0
选择方式如下图:
其中,要下载的内容包括 cuda工具包 和 4个补丁,为了避免出错,建议全部下载下来,不用接外网,校园网就很快,所有内容移动到Home文件夹下,便于后面使用终端直接进行操作,内容如下图所示:
b. 首先安装cuda工具包,之后才可以安装补丁;直接打开终端,输入如下指令,进行cuda工具包的安装:
sudo sh cuda_9.0.176_384.81_linux.run
(1)按q键跳过安装须知,输入accept接受。
(2)问你驱动装不装,输入n,选择不装,上面装过了。
(3)问你CUDA装不装,输入y,选择安装。回车键安装在默认位置(也可以自己选择位置安装)。
(4)问你要不要创建链接,输入y,选择创建。
(5)问你sample装不装,因为我们只是调用CUDA,不去写CUDA程序,输入n,选择不安装。
c. 添加路径库以及打补丁:
打开bashrc:
sudo vim ~/.bashrc
添加路径,可以加注释以便识别:
# 随便写点啥表示你自己写的不是电脑加的,删除的时候好识别
export PATH="/usr/local/cuda-9.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH"
使之生效:
source .bashrc
使用命令echo $PATH
和echo $LD_LIBRARY_PATH
查询是否添加成功,运行结果如下:
初次运行的时候不会出现没有那个文件和目录,不需要太在意。
打补丁:
像cuda9.0和cuda9.1都是有补丁的,打补丁很快(和安装cuda一样,不过简化很多):
sudo sh cuda_9.0.176.1_linux.run
sudo sh cuda_9.0.176.2_linux.run
sudo sh cuda_9.0.176.3_linux.run
sudo sh cuda_9.0.176.4_linux.run
按q退出协议,输入accept,再直接回车即可,每个补丁都如此。
d.验证:
查看nvcc编译器版本以确认cuda版本:
$ nvcc --version
最后一行表示cuda已经是9.0了。接着编译并运行示例代码,进入相应示例代码目录:
$ cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
编译并运行:
$ make -j # 如果报错就使用 sudo make-j
$ ./deviceQuery
运行结果如下:
最后的PASS表示程序测试通过,前面已经安装过驱动,因此在安装 cuda9.0 的时候不需要再安装驱动了!
a.官网下载cudnn7.0.5,需要注册一个新用户才可以。
需要下载的内容有如下几条:
cuDNN v7.6.0 Runtime Library for Ubuntu16.04 (Deb)
cuDNN v7.6.0 Develpoper Library for Ubuntu16.04 (Deb)
cuDNN v7.6.0 Code Samples and User Guide for Ubuntu16.04 (Deb)
cuDNN v7.0.5 Library for Linux
最后一个是必须下载的前三个是为了测试用,可以选择不下载,但一般还是要下载的,如图:
b. cd到下载路径解压文件:
tar -xzvf cudnn-9.0-linux-x64-v7.tgz
c. 安装cudnn
cd cuda
sudo cp include/cudnn.h /usr/local/cuda/include/
sudo cp lib64/* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.7
sudo ln -s libcudnn.so.7.6.0 libcudnn.so.7
sudo ln -s libcudnn.so.7 libcudnn.so
sudo ldconfig
其中里面的这些文件要根据自己的实际情况来确定
d. 进行cudnn的测试:
cd 到下载 deb 文件的目录下进行终端操作:
sudo dpkg -i libcudnn7_7.6.0.64-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.6.0.64-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.6.0.64-1+cuda10.0_amd64.deb
如果发生以下错误,则重新下载deb文件,再执行上面相关的命令行即可;
进行测试:
cp -r /usr/src/cudnn_samples_v7/ /home/wdong/
cd /home/wdong/cudnn_samples_v7/mnistCUDNN
make clean && make # 或者 sudo make clean && sudo make
./mnistCUDNN
测试结果如图:
说明cuDNN7.0.5安装成功,至此,cuda环境配置完毕,可以使用anaconda进行各种框架下gpu的配置了!
测试cudnn
nvidia cuda工具包更新9.0版本记录
Ubuntu 16.04 上安装 CUDA 9.0 详细教程
Ubuntu16.04安装NVIDIA驱动+CUDA9.0+cuDNN7.0
Ubuntu16.04 nvidia 显卡驱动过程及遇到的问题
ubuntu16.04下NVIDIA GTX965M显卡驱动PPA安装
虚拟环境需要自己创建,基于conda;
由于 cuda9.0 对应的 Pytorch 版本属于旧版本,因此需要在Pytorch官网进行下载;
本人下载的版本是 Pytorch1.1.0,如下图所示:
本人使用 conda 指令安装 ,安装截图如下:
可以发现,pytorch-1.1.0 和 torchvision-0.3.0 均没有国内的源,因此需要的时间比较长,耐心等待即可安装完毕,或者可以使用 wheel 提前下载,再 cd 到该目录下,使用 conda 或者 pip 安装即可,这种安装方式速度比较快!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。