当前位置:   article > 正文

【报错】1、RuntimeError: CUDA out of memory.2、torch.distributed.elastic.……erroes.ChildFailedError_torch.distributed.elastic.multiprocessing.errors.c

torch.distributed.elastic.multiprocessing.errors.childfailederror:

1、RuntimeError: CUDA out of memory. Tried to allocate 592.00 MiB (GPU 3; 10.76 GiB total capacity; 9.08 GiB already allocated; 296.56 MiB free……

解决:将batchsize设置小一点

2、torch.distributed.elastic.multiprocessiong.erroes.ChildFailedError
多GPU训练时报如上错误
解决:将batchsize设置小一点

吐槽一下:实验室做机器学习的条件太艰苦了呜呜呜……

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号