赞
踩
近年来,训练越来越大的语言模型已成为常态(悟道 2.0 模型参数量已经到达 1.75T ,为 GPT-3 的 10 倍)。但如何训练大型语言模型的信息却很少查到 。
通过查找,这里整理了简单的训练指南
以 BLOOM-175B 的训练为例
这里为 BLOOM 的训练使用的硬件设施,可以参考 本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/正经夜光杯/article/detail/946452
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。