当前位置:   article > 正文

如何处理GPU训练过程中出现内存申请大小为0的错误【The memory alloc size is 0】

如何处理GPU训练过程中出现内存申请大小为0的错误【The memory alloc size is 0】

【现象描述】

GPU上网络运行过程中出现内存申请大小为0的错误,报错日志中有如下信息:

The memory alloc size is 0

【原因分析】

该错误出现是由于内存申请的时候调用接口时传入的申请size为0,因此报错,碰到场景非常少,一般原因是数据集读取的数据是空导致size为0

【排查步骤和解决方法】

步骤1:排查数据集中读取的数据是否有问题,可以通过context.set_context(save_graphs=True)保存图,然后观察*_validate*.ir这一类ir是否生成,如果未生成则说明图还未执行就报错了,基本上就确认了数据集读取数据出现问题了,可以自行排查或者联系MindData开发人员确认。

步骤2:如果前面步骤确认没有问题的话,需要MindSpore开发人员详细分析了,context.set_context(save_graphs=True)同时export GLOG_v=1保存执行日志,将保存的图和日志打包发给开发人员排查确认。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/303574
推荐阅读
相关标签
  

闽ICP备14008679号