赞
踩
遇到此类错误后,对于py格式的文件来说,程序会进行终止,也就是当前程序占用的显存将会被释放。此时可用 watch -n 1 nvidia-smi 命令查看当前显存的使用情况。如果此时显存依然有比较大的占用,说明存在其他程序占用显存,使用kill命令结束不必要的程序即可。
使用方法torch.cuda.is_available(),确认pytorch和cuda是否匹配,如果返回False,需要调整一下cuda或torch的版本,重新部署一下环境。
如果使用的是jupyter notebook,遇到错误时显存并不会被释放,笔者在网上查到的方法是可用torch.cuda.empty_cache()删除一些不需要的变量,并且测试代码之前使用with torch.no_grad()。但是我尝试过后发现torch.cuda.empty_cache()貌似并不能解决notebook中的显存占用。查询官网API,官方的说明是:
Releases all unoccupied cached memory currently held by the caching allocator
https://pytorch.org/docs/stable/cuda.html?highlight=empty_cache#torch.cuda.empty_cache
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。