赞
踩
在现代的异构计算系统中,GPU 是以 PCIe 卡的形式作为 CPU 的辅助计算设备。根据 CPU 和 GPU 是否共享了内存,可分为两种类型的 CPU-GPU 异构计算架构:
分离式架构的缺点在于 PCIe 传输成了其中的性能瓶颈,例如:PCIe Gen3 x1 理论带宽约为 1000MB/s,所以对于 Gen3 x32 的最大带宽约为 32GB/s,而受限于本身的实现机制,有效带宽往往只有理论值的 2/3,甚至更低。
由于,CPU 与 GPU 之间的通信开销是比较大的。而针对 GPU 之间的互连,Nvidia 推出 NVLink 技术替代传统 PCIe 总线的方式,根据 Nvidia 官网数据,GPU 性能提升了 5 倍。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。