赞
踩
(1)CPU指标:CPU的主要指标是主频和线程,当然也有一些其他因素影响,这里仅分析这两个主要的指标。
(2)目前主流硬件分析:
型号 | 主频 | 线程 | 功耗 |
---|---|---|---|
i9-12900K | 基础频率 3.2 GHz,最高睿频5.2GHz | 8 E-core,8 P-core,24线程 | 基础功耗125W,最大功耗241W |
i9-12900H | 基础频率2.5GHz,最高睿频5.0GHz | 8 E-core,6 P-core,20线程 | 基础功耗45W,最大功耗115W |
i7-12700K | 基础频率3.6GHz,最高睿频5.0GHz | 4 E-core,8 P-core,20线程 | 基础功耗125W,最大功耗190W |
i9-11900K | 基础频率3.5GHz,最高睿频5.3GHz | 8 core,16线程 | 基础功耗125W |
i5-11600K | 基础频率3.7GHz,最高睿频4.9GHz | 4 E-core,6 P-core,16线程 | 基础功耗125W,最大功耗150W |
(3)CPU选购:
(1)GPU性能与影响因素:GPU的性能主要来自几个方面:制程技术(nm)、GPU架构、线路设计、数字表示方式;一般认为 制程技术的进步大概只能让GPU的性能提高到原来的1.5或2倍,GPU性能的提升主要是靠GPU架构和线路设计、数字表示方式的完善。
(2)GPU相比与CPU的特点:GPU的架构适合集群。上述GPU架构的更新同时也进行了集群方案的更新。
(3)深度学习对硬件的要求:
(4)主流GPU设备的推理速度:https://developer.nvidia.com/cuda-gpus
GPU | Compute Capability | TFLOPS | GPU | Compute Capability | TFLOPS |
---|---|---|---|---|---|
Jetson AGX Xavier | 7.2 | (NVIDIA Pascal™ 架构)32 | GeForce RTX 3090 Ti | 8.6 | Ampere架构40单精度, |
Jetson nano | 5.3 | 0.5 | GeForce RTX 3090 | 8.6 | Ampere 架构,35.58 |
Jetson TX2 | 6.2 | 1.33 | GeForce RTX 3080 Ti | 8.6 | 34.10 |
Tesla K20 | 3.5 | 3.52(单精度),1.17(双精度) | GeForce GTX 1650 Ti | 7.5 | |
Tesla K40 | 3.5 | 4.29(单精度),1.43(双精度) | Geforce RTX 2080 Ti | 7.5 | 26.90 |
Tesla K80 | 3.7 | 8.74(单精度),2.91(双精度) | GeForce GTX 1080 Ti | 6.1 | 11.34 |
NVIDIA A100 | 8.0 | 19.5(单精度),9.7(双精度) | GeForce GTX 1060 | 6.1 | |
NVIDIA V100 | 7.0 | 15.7(单精度),7.8(双精度),112(Tensor) | GeForce GTX 1050 | 6.1 | |
GTX Titan x | 5.2 | 7(单精度),0.2(双精度) | GeForce GTX 3080 | 8.6 | 29.77 |
Note:单精度能够保证小数点后6到7位计算准确(2^23),双精度则是14到15位(2^52)
这里的 Compute Capability 并不是我们常说的 TFLOPS 算力,它只是英伟达给自己支持 CUDA 的 GPU 设置的一个“版本号”而已,代表着这个GPU具备什么样的功能,版本号越高说明 GPU 的工具包越新,支持的功能越新;一般的算力评价指标:TFLOPS(具体分单精度、双精度、Tensor);
一般来说,在硬件架构相同的条件下,核越来以及带宽越高,性能就越好。
1.英伟达首席科学家:深度学习硬件的过去、现在和未来:https://mp.weixin.qq.com/s/ofWCgv-ksJjqGH0qlbW8nw
2.内存带宽与计算能力,谁才是决定深度学习执行性能的关键?:https://cloud.tencent.com/developer/article/1117817
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。