赞
踩
更新日志:
20220404:新增一个DDP 加载模型时显存分布不均问题,见目录遇到的问题及解决处
主要是上次server12 被自己一个train 直接线程全部拉满了(没错 … server8 也被拉满过 emm我一开始还没发现 原来是我拉满的)
现场实况
后面刘所就跟我说让我看看是不是dataset里面的处理太多了,这样下来GPU占着 使用率也不高,建议先处理完了再直接由load进来 直接训练;因为server上的cpu都不是很好,一开始那样玩会拉慢训练速度,两种选择:
下面主要就是针对前言里面说的两条进行分析与方案确认
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。