当前位置:   article > 正文

【20230407】NVIDIA显卡算力、Jetson比较

显卡算力

1 基本概念

1.1 算力单位

TOPS:指的是每秒钟可以执行的整数运算次数,它代表着计算机在处理图像、音频等任务时的处理能力。TOPS的单位是万亿次每秒(trillion operations per second)。一般是指整数运算能力INT8

TFLOPS:指的是每秒钟可以执行的浮点运算次数,它代表着计算机在处理科学计算、机器学习等任务时的处理能力。TFLOPS的单位是万亿次每秒(trillion floating point operations per second)。一般是指单精度性能FP32

MFLOPS:等于每秒一百万次浮点运算。(megaFLOPS)

GFLOPS:等于每秒十亿次浮点运算。(gigaFLOPS)

PFLOPS:等于每秒一千万亿次浮点运算。(petaFLOPS)

1.2 内存带宽

内存带宽是指从计算机主板到内存之间传输数据的速度。它通常用作衡量内存性能的指标之一,以确定计算机可以快速读取和写入内存中的数据量。

内存带宽的大小取决于内存总线的宽度和内存频率的乘积。例如,如果内存总线宽度为64位,内存频率为1600 MHz,则内存带宽为64位 x 1600 MHz = 12.8 GB/s。

内存带宽的大小会直接影响计算机的算力,因为它可以限制计算机能够快速读取和写入数据的数量。如果内存带宽不足,计算机可能需要等待更长的时间才能读取或写入数据,从而降低了计算机的效率。特别是在处理大规模数据集和运行需要大量内存的应用程序时,内存带宽的大小会更加重要。因此,在选择计算机配置时,需要考虑内存带宽和其他关键指标,以确保计算机能够满足特定的计算需求。

1.3 DMIPS

DMIPS(Dhrystone Million Instructions Per Second,每秒处理的百万级的机器语言指令数),描述的是 CPU 的运算能力。

自动驾驶多传感器融合的滤波算法,激光点云的配准算法,多数的路径规划和决策算法考验的都是 CPU 的运算能力。

1.4 ASIC

ASIC(Application-Specific Integrated Circuit)是指应用特定集成电路,是一种定制的、用于特定应用的集成电路。与通用集成电路(如微处理器)不同,ASIC是针对特定应用进行设计和制造的,可以优化电路的性能和功耗,从而满足特定应用的要求。ASIC通常用于高性能计算、通信、图形处理等领域。

ASIC设计需要经过电路设计、逻辑设计、物理设计、验证等多个步骤,因此制造成本较高,但在高端应用中可以获得很高的性能和可靠性。与FPGA相比,ASIC在性能、功耗和面积等方面都具有优势,但缺乏FPGA的灵活性和可编程性。

ASIC 加速器包括 CVP(Computer Vision Processors,计算机视觉处理器),DLA 和 MA(Multithreaded Accelerator,多线程加速器),其中 18 颗 CVP 是 Mobileye 的下一代针对传统计算机视觉算法设计的 ASIC 芯片。芯片整体的 AI 算力设计只有 24TOPS。

例如:Jetson中的DLA深度学习加速就是一种ASIC。

2 GeForce 30x系列

在这里插入图片描述

3 Jetson

在这里插入图片描述

参考1:AI芯片,自动驾驶里的「水浒卡」
参考2:芯参数

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/998968
推荐阅读
相关标签
  

闽ICP备14008679号