赞
踩
最近在训练SSD模型时发现GPU的利用率只有8%,而CPU的利用率却非常高。
后来了解到,一般使用CPU进行数据的读取和预处理,而使用GPU进行模型的正向传播和反向传播。由于CPU数据读取跟不上(读到内存+多线程+二进制文件),而GPU的处理速度太快,导致GPU的利用率不高。
最后总结一下,有的时候模型训练慢并不是因为显卡不行或者模型太大,而是在跑模型过程中有一些其他的操作导致速度很慢,尤其是文件的IO操作,这会导致GPU得不到连续性使用,整体速度特别慢。
问题的解决办法:
1,关闭一些日志记录,减少日志IO操作频率。
2,NVIDA提供了DALI库,可以将数据处理转移到GPU上。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。