赞
踩
例如,六核A55架构,主频为1.6GHz,性能为2.7DMIPS/MHz,算力DMIPS = 6 * 1660MHz * 2.7DMIPS/MHz = 31374 DMIPS.
特斯拉的FSD芯片,96x96 MAC,主频2GHz
TOPS = 96 * 96 * 2000000000 * 2 = 36.864 TOPS
MAC/FMA的全称为Fused Multiply–accumulate operation, 也就是乘积累加指令,这种指令集融合了加法和乘法,使得处理器能够在一个指令中同时完成乘法和加法操作,从而提高了计算效率。
SIMD的全称叫做,单指令集多数据(Single Instruction Multiple Data)。最直观的理解就是,向量计算。比如一个加法指令周期只能算一组数(一维向量相加),使用SIMD的话,一个加法指令周期可以同时算多组数(n维向量相加),二者用时基本相等,极大地提高了运算效率。
原文链接:https://blog.csdn.net/qq_51563654/article/details/131161576
1 TFLOPS = 10^3 GFLOPS = 10^6 MFLOPS = 10^12 FLOPS
单个周期浮点计算值(双精度)=FMA数量*2(同时加法和乘法)*512/64
单个周期浮点计算值(单精度)=FMA数量*2(同时加法和乘法)*512/32
单精度和双精度浮点运算概念,简单的理解单精度就是指32bit的指令长度的运算,对应操作系统就是32位操作系统;双精度就是指64bit指令长度的运算,对应操作系统就是64位操作系统。
512:这个数值可能指的是CPU的某些硬件特性,如SIMD(Single Instruction, Multiple Data)宽度。SIMD宽度是CPU能够同时处理的数据元素数量。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。