当前位置:   article > 正文

报错:If reserved memory is >> allocated memory_if reserved memory is >> allocated memory try sett

if reserved memory is >> allocated memory try setting max_split_size_mb to a

If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

代表目前可分配的显存足够,但是因为碎片化无法分配,需要整理碎片化显存,释放出能够用于运行的容量。

显存管理机制:RuntimeError: CUDA out of memory.一些调bug路程 - 知乎                           一文读懂 PyTorch 显存管理机制 - 知乎

解决方法:

        1.运行模型前添加下面两行代码,将小于128Mb大小的空闲显存block重新分配:

  1. import os
  2. os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "max_split_size_mb:128"

        2.如果还是报错,可以在训练前添加下面两行代码,清理缓存:

  1. if hasattr(torch.cuda, 'empty_cache'):
  2. torch.cuda.empty_cache()

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/220629
推荐阅读
相关标签
  

闽ICP备14008679号