当前位置:   article > 正文

全网最全RuntimeError: CUDA error: out of memory解决方法

runtimeerror: cuda error: out of memory

第一种情况

如果这个报错后面跟了想要占用多少显存但是不够这样的字眼,如下:
在这里插入图片描述
解决办法就很简单了:

第二种情况

直接报错OOM没有说申请多少显存而不够的字眼。如下:
在这里插入图片描述
这个情况比较特殊,有多种原因:

  • 原因一:linux下某个用户存在了显存泄露,如果是自己的账号有显存泄露,执行fuser -v /dev/nvidia*然后将提示的进程kill掉即可,如果是其他用户显存泄露,需要管理员权限,执行以下命令,执行前最好跟所有用户通知下,不然再跑的任务会被杀了。但是出现这样显存泄露的情况,所有的用户都会用不了显卡,所以应该不会有任务在跑(猜测):
sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh
  • 1
  • 原因二:网上看到的,据说模型加载的参数和自己pytorch的版本不匹配就会报错这个,例如你的pretrain使用torch1.1.0训的,你用torch1.2.0的代码加载这个参数就有可能报错。这个没经历过,仅仅看到记录下。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/89076
推荐阅读
相关标签
  

闽ICP备14008679号