赞
踩
CUDA kernel errors might be asynchronously reported at some other API call
在运行基于pytorch的深度学习项目时,有时候会遇到上述错误,并且在报错时没有定位到正确的位置。
这里查阅了很多网上的相关资料,说是分类数目和模型里的实际分类数目不匹配,大家可以仔细查看一下这个。也有说是在计算logits之前先进性softmax归一化,大家也可以试试这个方法。
我仔细检查自己的项目分类数目,发现并不是上述原因,因此需要先定位到实际导致错误的代码位置。
我们的目的是定位到实际导致报错的代码位置,只需要在最开头添加:
import os
os.environ['CUDA_LAUNCH_BLOCKING'] = '1'
这时候报错会定位到实际位置,大家对症下药解决即可。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。