当前位置:   article > 正文

【环境搭建】 在Ubuntu16.04上安装nvidiaGPU驱动和cuda_sudo apt install nvidia-cuda-toolkit

sudo apt install nvidia-cuda-toolkit

【环境搭建】 在Ubuntu16.04上安装nvidiaGPU驱动和cuda

安装过程

图1
这是我手动安装nvidia显卡驱动成功后的软件和更新界面,在手动安装前不要选择使用"NVIDIA binary driver"这个选项让系统自动安装,会出现图形界面循环登录的情况。可以用ctrl+alt+F4(我的是F4,网上有人说是F0,就从F0往后按,总有一个是对的)进入命令行界面,然后删除系动自动安装的驱动,就可以重新进入图形界面:

sudo apt-get updata
sudo apt-get install --reinstall ubuntu-desktop
sudo apt-get install unity
sudo apt-get remove --purge nvidia*
shutdown -r now
  • 1
  • 2
  • 3
  • 4
  • 5

重新进入图形界面后,尝试手动安装:

# 给blacklist.conf可读可写权限
# 二进制100,就是4,是可读权限
# 二进制110,就是6,是可读可写权限
# 二进制111,就是7,是可读可写可执行权限
sudo chmod 666 /etc/modprobe.d/blacklist.conf
sudo vim /etc/modprobe.d/blacklist.conf
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
# 在文件最后添加:
blacklist nouveau
options nouveau modeset=0
  • 1
  • 2
  • 3
# 更新系统
sudo update-initramfs -u
  • 1
  • 2

然后要重新启动电脑

lsmod | grep nouveau
# 如果没有信息显示,说明nouveau已经被禁用
  • 1
  • 2

https://www.nvidia.cn/下载对应自己显卡型号的驱动,下载的是一个.run的驱动

如何查看自己电脑的显卡型号呢?

lspci | grep -i nvidia
  • 1

图
将最后的十六进制序号(我这里是1c8c)输入到The PCI ID Repository,可以查询显卡型号
在这里插入图片描述
tu
驱动和显卡型号不对应会导致循环登录

在安装前首先禁用UEFI安全启动功能,否则会导致驱动安装失败,启动电脑,按F2,将Security选项卡中的Secure Boot选项由Enabled更改为Disabled,保存开机。

将这个驱动放在home路径下,这个操作只是方便待会进入命令行操作后这个文件容易找
用ctrl+alt+F4(我的是F4,网上有人说是F0,就从F0往后按,总有一个是对的)进入命令行界面,然后:

# 关掉图形界面
sudo service lightdm stop
# 给.run文件可执行权限
sudo chmod  a+x NVIDIA-Linux-x86_64-430.26.run
sudo ./NVIDIA-Linux-x86_64-430.26.run -no-x-check -no-nouveau-check -no-opengl-files
  • 1
  • 2
  • 3
  • 4
  • 5

进入安装界面后,基本都是选择默认选项,一路enter
安装完成后,回到命令行界面,然后:

# 挂载nvidia驱动
modprobe nvidia
# 查看GPU信息,正常显示则安装成功
nvidia-smi
# 回到图形界面
sudo service lightdm start
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

接下来,安装cuda和cudnn,cudnn的安装过程在【环境搭建】 测试gpu的bandwidth;p2p的bandwidth测试;以及使用DeepBench测试conv、矩阵乘法的运算能力中有介绍
https://developer.nvidia.com/cuda-toolkit-archive下载cuda的安装包
图2

sudo chmod  a+x cuda_10.0.130_410.48_linux.run
sudo ./cuda_10.0.130_410.48_linux.run
  • 1
  • 2
Do you accept the previously read EULA?
accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
n

Install the CUDA 10.0 Toolkit?
y

Enter Toolkit Location
按提示的默认的填进去

Do you want to install a symbolic link at /usr/local/cuda?
y

Install the CUDA 10.0 Samples?
y

Enter CUDA Samples Location
测试用的程序,怕麻烦以后忘了这个是什么就和上一个路径填同一个
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20

等待安装完成

如果安装失败,报错:you appear to be running an x server please exit x before installing…,是因为图形界面占用了显存,用nvidia-smi命令可以看见占用显存的进程/usr/lib/xorg/Xorg。此时和安装驱动相同,先关闭图形界面服务,然后安装cuda即可。

填加环境变量,和之前一样,在.bash_profile中添加(在.bashrc中添加source .bash_profile,这样就不用每次执行source .bash_profile了

# cuda
export LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64":$LD_LIBRARY_PATH
export PATH="/usr/local/cuda-10.0/bin":$PATH
export CUDA_HOME="/usr/local/cuda-10.0":$CUDA_HOME
# 具体路径还要看你上面的选择
  • 1
  • 2
  • 3
  • 4
  • 5
# 查看cuda版本,如果对应安装的版本,则安装成功
nvcc --version
  • 1
  • 2

安装cuda成功

如果报错程序“nvcc”尚未安装,千万不要执行

sudo apt install nvidia-cuda-toolkit
  • 1

这会安装另一个cuda,导致循环登录问题
检查环境变量配置路径是否有问题,PATH的路径下是有nvcc的可执行文件的

卸载安装好的nvidiaGPU驱动

用ctrl+alt+F4(我的是F4,网上有人说是F0,就从F0往后按,总有一个是对的)进入命令行界面,然后:

# 关掉图形界面
sudo service lightdm stop
# 卸载nvidiaGPU驱动
sudo /usr/bin/nvidia-uninstall
# 回到图形界面
sudo service lightdm start
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

结语

如果您有修改意见或问题,欢迎留言或者通过邮箱和我联系。
如果我的文章对您有帮助,转载请注明出处。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/221240
推荐阅读
相关标签
  

闽ICP备14008679号