走近 AI Infra 架构师：在高速飞驰的大模型“赛车”上“换轮子”的人_评估大模型训练infra的效率

作者：木道寻08 | 2024-06-26 13:19:02

踩

评估大模型训练infra的效率

如果把大模型训练比作 F1 比赛，长凡所在的团队就是造车的人，也是在比赛现场给赛车换轮子的人。1% 的训练提速，或者几秒之差的故障恢复时间，累积起来，都能影响到几百万的成本。长凡说：“大模型起来的时候，我们非常兴奋，因为 DLRover 天生就是为大模型训练的场景设计的。”

目前业界普遍认为数据、算力、算法是大模型训练的三大核心要素，AI 工程的价值似乎还没有得到足够的重视，我们和蚂蚁 DLRover 开源负责人长凡深入聊了聊，聊到了他为何在大模型出现前就选择了 AI Infra 的赛道，他参与开源的经历，也聊了 DLRover 诞生背后的故事。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/木道寻08/article/detail/759464

推荐阅读

相关标签