赞
踩
在【显卡】一文搞懂显卡 详细解释了显卡。不懂的小伙伴可以去看看。
显卡(Video card、Display card、Graphics card、Video adapter)是个人计算机基础的组成部分之一,将计算机系统需要的显示信息进行转换驱动显示器,并向显示器提供逐行或隔行扫描信号,控制显示器的正确显示,是连接显示器和个人计算机主板的重要组件,是“人机”的重要设备之一,其内置的并行计算能力现阶段也用于深度学习等运算。
本文我们主要讲讲两个著名显卡芯片公司的产品。
Nvidia和AMD,实际上并不是显卡的牌子,它们是专门生产显卡中最重要的显示芯片。就好比是两家专门生产汽车中发动机的厂商一样,它们本身并不生产整辆汽车。采用了英伟达或者AMD显示芯片的显卡,一般被人们叫做英伟达显卡或者AMD显卡。
NVIDIA,也就是俗称的N卡,是专业视觉计算领域的领导者,1999年研发的GPU极大推动了PC游戏市场的发展、重新定义了现代计算机图形技术,并彻底改变了并行计算。现在,GPU深度学习为现代 AI 这个全新计算时代提供了新动力。
其一大特色是对AI生态的适应(CUDA)广泛应用于AI领域(beat AMD)。CUDA技术,一种基于NVIDIA图形处理器(GPU)上全新的并行计算体系架构,让科学家、工程师和其他专业技术人员能够解决以前无法解决的问题,作为一个专用高性能GPU计算解决方案,NVIDIA把超级计算能够带给任何工作站或服务器,以及标准、基于CPU的服务器集群 CUDA是用于GPU计算的开发环境,它是一个全新的软硬件架构,可以将GPU视为一个并行数据计算的设备,对所进行的计算进行分配和管理。在CUDA的架构中,这些计算不再像过去所谓的GPGPU架构那样必须将计算映射到图形API(OpenGL和Direct 3D)中,因此对于开发者来说,CUDA的开发门槛大大降低了。CUDA的GPU编程语言基于标准的C语言,因此任何有C语言基础的用户都很容易地开发CUDA的应用程序。 由于GPU的特点是处理密集型数据和并行数据计算,因此CUDA非常适合需要大规模并行计算的领域。CUDA除了可以用C语言开发,也已经提供FORTRAN的应用接口,未来可以预计CUDA会支持C++、Java、Python等各类语言。可广泛的应用在图形动画、科学计算、地质、生物、物理模拟等领域。2008年NVIDIA推出CUDA SDK2.0版本,大幅提升了CUDA的使用范围。使得CUDA技术愈发成熟。
英伟达(NVIDIA)是美国一家专业的计算机图形芯片制造商,英伟达显卡市场份额占据全球第一的位置,英伟达的显卡产品系列涵盖GeForce、Quadro、Tesla、NVS、GRID等,满足不同领域的应用需求。
GeForce显卡:GeForce显卡是英伟达公司推出的主流消费级显卡,其型号包括GTX1050、GTX1050ti、GTX1060、GTX1070、GTX1080、GTX1080ti、RTX2060、RTX2070、RTX2080、RTX2080ti、RTX3080(90)、RTX4080(90)等。
Quadro显卡:Quadro显卡是英伟达公司推出的专业级显卡,其型号包括Quadro K620、Quadro K1200、Quadro K2200、Quadro K4000、Quadro K4200、Quadro K5000、Quadro K5200、Quadro P400、Quadro P600、Quadro P1000、Quadro P2000、Quadro P4000、Quadro P5000、Quadro P6000等。
Tesla显卡:Tesla显卡是英伟达公司推出的深度学习用显卡,其型号包括Tesla K40、Tesla K80、Tesla P4、Tesla P40、Tesla P100、Tesla V100、Tesla T4、Tesla M40、Tesla M60、A40、A100、A800等。
NVS显卡:NVS显卡是英伟达公司推出的多屏显示用显卡,其型号包括NVS 310、NVS 315、NVS 510、NVS 810、NVS 510M、NVS 810M等。
GRID显卡:GRID显卡是英伟达公司推出的虚拟化用显卡,其型号包括GRID K1、GRID K2、GRID M60-1Q、GRID M60-2Q等。
总的来说,英伟达显卡大全及其型号有GeForce、Quadro、Tesla、NVS、GRID等,各类型号的显卡都有其自身的优势,可以满足不同领域的应用需求。英伟达显卡的市场份额占据全球第一的位置,也深受全球用户的喜爱和认可,令英伟达的显卡更加的受欢迎。
参数上A100只有19.5T fp32浮点,而3090有35T,本以为3090会比A100快(不使用混合精度的情况下),但是看了网上几篇对比文,居然发现都是A100比3090要快?而且还快不少?
这其实是一个非常有意思的问题,但很多回答都没有抓住重点。
因此,在深度学习里,不管你是用 CNN 还是 Transformer,绝大多数的浮点计算量都集中在矩阵乘法上面,而这部分的负载恰好能用 tensor core 运行。即便不主动使用混合精度, 一些框架也会默认使用 TF32 进行矩阵计算,因此在实际的神经网络训练中,A100 因为 tensor core 的优势会比 3090 快很多。
再来说一下二者的区别:
对于需要科学计算精度的科研来说,只能选择A100这样的双精度计算能力强的GPU,要不然花了时间做出来的结果也不正确。
想要对比更多的GPU型号,可以去这个网站:芯参数评测
AMD的显卡我们俗称的A卡,其实最早A卡并不是AMD的而是ATI的,ATI在2006年被AMD以54亿美元的巨资收购了,成为了AMD的一部分,此后AMD宣布放弃ATI品牌,将旗下所以显卡都统一更名为AMD。
说起AMD,作为搞计算机AI领域的,虽然也有与cuda对应的rocm,但是确实不如Nvidia对于AI生态的适应。AMD在深度学习确实非常费劲,rocm只有linux系统下支持,你还得双系统。另外官方兼容列表只有6800系列,6700/6600以下和更早的a卡还得折腾,不能保证能运行。总而言之纯粹是玩票产物,离生产力差的太远。
再说起AMD显卡,什么560,560d,560xt,500x系列,584,588,590,5882048sp,vega,raedon是不是一下就懵逼了呢?
此外AMD卡清库存的速度比隔壁(Nvidia)慢,甚至有时候两代马甲卡能一起卖半年,进一步加剧了这种混乱(拿不出新架构,新核心,疯狂马甲炒冷饭导致的AMD产品线混乱),总的来说,AMD是走一步看一步,而Nvidia是看一步走一步。
说完AMD卡型号混乱,疯狂马甲炒冷饭,但是A卡还是有自己的优势:
首先是前缀,这几年AMD新显卡的前缀都是RX开头,如RX580、RX5700、RX6900等,
然后就是中间的数字,RX580就表示第5代,这个数字越大越好。后面的数字也是越大越好,
最后就是后缀了,X2表示双芯片,这个是AMD同代产品里面最好的,
需要注意的是RX400系与RX500系之后并不是600系,而是RX Vega系列,比如RX Vega56和RX Vega64,对标的是GTX1080。50周年纪念版RX5700、RX5700XT,其对标的是英伟达的RTX2060/2070。
看不懂没关系,下面给大家带上一张显卡的天梯度,有点老,你就可以一眼看到各类显卡,不同型号的位置排名,RX 6000>RX 5000>RX 400/500/Vega>Radeon R300>Radeon R200>Radeon HD。(可以点击图片之后放大观看)。
最后也是总结一下,A卡的优势在于:
当然,A卡也有缺点:
前面几部分其实也说了,这里直接说结论吧。
【1】https://www.zhihu.com/question/535130416/answer/2922531526
【2】https://www.knowbaike.com/it/60078.html
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。