赞
踩
最开始听说Docker保存镜像后可以直接移植以便后续使用,在Ubuntu的驱动崩溃之后,为了节省时间果断换回Windows,结果Docker镜像彻底不能用GPU了。
只能说,目前也没有找到一个合理的解决方案。
由于以前在Ubuntu2204
版本中使用nvidia-docker
跑通了一个镜像,专门用来跑实验,但结果突然一下内核强制更新显卡崩溃,为了节省时间只能使用Windows
紧急避难。
可没想到,由于Ubuntu
和Windows
的差别太大,哪怕是用WSL
部署的Ubuntu
也会或多或少与真正Ubuntu
存在一定的差别。
于是在尝试使用容器跑镜像的时候,一直报这个错误:
docker: Error response from daemon:
failed to create shim task:
OCI runtime create failed: runc create failed:
unable to start container process: error during container init:
error running hook #0:
error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy'
nvidia-container-cli:
mount error:
file creation failed:
/var/lib/docker/overlay2/a08010dd0dfc114c462f44fda3d523e614eef12c8e349cf7bf14c44473c94fd1/merged/usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1:
file exists:
unknown.
ERRO[0000] error waiting for container: context canceled
如果有一定的经验,你也应该发现了问题:在镜像中找不到libnvidia-ml.so.1
。
由于是将镜像使用save
命令保存下来的,所以实在是没有办法了。
所以,记录到这篇博客中,千万不要再犯了。
既然彻底不能用了,那就只要用CPU
了。
原本好好的--gpus all
需要删掉。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。