赞
踩
目录
1. 背景
前两篇文章我们介绍的GPUDirect P2P和NVLink技术可以大大提升GPU服务器单机的GPU通信性能,当前深度学习模型越来越复杂,计算数据量暴增,对于大规模深度学习训练任务,单机已经无法满足计算要求,多机多卡的分布式训练成为了必要的需求,这个时候多机间的通信成为了分布式训练性能的重要指标。
本篇文章我们就来谈谈GPUDirect RDMA技术,这是用于加速多机间GPU通信的技术。
2. RDMA介绍
我们先来
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。