赞
踩
Ubuntu
20.04安装CUDA
失败导致系统黑屏消息nvidia 0000:01:00.0: can't change power state from D3cold to D0
的解决方法贺志国
前天,因为无聊,将CUDA 11.7
升级到CUDA 12.0
,安装完成后重启,系统黑屏,提示信息如下:
nvidia 0000:01:00.0: can't change power state from D3cold to D0
一看就是CUDA安装失败导致Nvidia显卡驱动异常了,于是只能在命令行中修复解决了。
我的电脑是联想Thinkbook,这个电脑选择开机菜单比较繁琐,具体方法如下:
shift+esc
键进入grub
菜单,选择ubuntu
高级选项,注意不要一直按着shift+esc
键不动,这样会直接进入grub
提示界面,只需按一次即可;recovery mode
模式敲回车,到恢复模式主菜单界面;fsck check all filesystems
,一直敲回车,直到再次返回到恢复模式主菜单界面;root drop to root shell prompt
敲回车,进入命令行界面。CUDA 12.0
罪魁祸首肯定是CUDA 12.0
,于是需要删除它,命令如下:
sudo apt-get --purge remove "*cublas*" "*cuda*" "nsight*"
删除 Nvidia 驱动程序:
sudo apt-get --purge remove "*nvidia*"
但上述命令基本上不能够将CUDA 12.0
清理干净,使用如下命令查找:
sudo find / -iname "*ubuntu2004-12*"
sudo find / -iname "*cuda12*"
再使用rm -f
命令将搜索到的文件全部删除。执行如下修复安装命令:
sudo apt-get --fix-broken install
重启电脑,就可重新进入Ubuntu图形化界面。
CUDA
CUDA
程序可在进入图形化界面之前安装,也可在进入图形化界面后安装,只要确保网络连接正常就行。因为CUDA
里面自带了Nvidia
显卡驱动,因此安装CUDA
前不需要安装Nvidia
显卡驱动(安装不匹配的显卡驱动反而容易坏事)。
下面以我安装的CUDA 11.7
为例,列出安装命令如下:
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda-repo-ubuntu2004-11-7-local_11.7.0-515.43.04-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-11-7-local_11.7.0-515.43.04-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-11-7-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda
安装完毕后,使用如下命令验证安装是否正常
nvidia-smi
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。