当前位置:   article > 正文

GPU集群管理问题记录_gpu集群问题定位

gpu集群问题定位

1. GPU卡无任务运行但显存占用情况处理

https://devtalk.nvidia.com/default/topic/958159/cuda-programming-and-performance/11-gb-of-gpu-ram-used-and-no-process-listed-by-nvidia-smi/

  1. sudo fuser -v /dev/nvidia* 找到占用显存的任务PID
  2. kill -9 PID kill掉任务即可

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/707861
推荐阅读
相关标签
  

闽ICP备14008679号