赞
踩
今天分享的是AI算力专题系列深度研究报告:《AI算力专题:海外科技启示录,英伟达超级工厂是怎样炼成的》。
(报告出品方:浙商证券)
报告共计:34页
精选报告来源/公众号:海选智库
英伟达:全球算力王者,加速计算时代的 AI超级工厂
公司成立自 1993年,早期专注图形计算芯片,针对游戏机、PC市场,2006年推出 CUDA 进军通用计算,逐步形成 GPU+CPU+DPU 的三芯布局,应用领城也从游戏拓展至数据中心、专业可视化、自动驾驶等,目标客户涵盖CSP、商业企业、消费者;公司上市以来,收入成长超160倍,市值增长超2700倍,在全球AI芯片市场的市占率最高已经达到 90%。
历史复盘:强自研+前瞻并购丰富产品矩阵,通用生态形成坚实护河
(1)2000年前,从“狂野西部”通用图形计算起步,凭借更加高效的研发模式、郸定大客户微软胜出并定义世界首款GPU:研发上,公司采用了“三团队-两季度”的高效研发模式实现了技术和产品的快速速代;产品上,通过DDR、SDR和TNT 三个系列实现了高中低端的全面布局;战略上,绑定大客户微软,凭借Windows 95 操作系统的高占有率打败并收购图形计算先驱 3dfx;(2)2000-2005年,客户多元化,通过性能优势掌提PC独显龙头地位:上市初期,公司与微软合作失败并导致业绩和股价的调整,后续公司积极开拓Intel、索尼等大客户,并通过 GeFroce 6800Ultra 优异的产品性能再次夺回 GPU 老大的地位,同时打败了竞争对手 ATI;
(3)2006-2015年,以游戏业务筑基,培育以CUDA为核心的通用计算体系:在终端多元化导致 PC出货量下降的背景下,公司聚焦高端游戏卡稳定增长态势并实现了逆势增长,2010-2015年游戏业务收入五年CAGR达到21%:2006年公司超前推出CUDA,从图形计算拓展至通用计算,虽然在前期经历了产品生态不完善导致的业绩和股价的调整,但是公司坚持投入研发,研发费用逐年攀升,形成了快连选代的硬件+深度捆绑的软硬件+大量外围的二次开发者和易用的软件生态三位一体的生态飞轮。
(4)2016年至今,CUDA开花结果,云端数据中心业务开启新一轮成长曲线:算力需求侧经历了大数据及云服务(2016-2018)、云端办公和娱乐(2020-2021),云端 AI训练(2023 至今)三大阶段,公司套娃式收购了1B 和以太网领军 Mellanox、网络安全和智能 IP 提供商 Titan IC,并形成了 GPU+CPU+DPU 三芯底座,公司凭借综合全面的生态优势在三次浪潮中逐步崛起,2023 年数据中心业务收入475.25 亿美元,同比增长224.36%,
成长之路总结:专注带来前瞻,通用诞生生态
(1)专注计算芯片,带来前瞻战略思雄:公司三十年专注计算芯片,并保持在单一赛道上超过竞争对手的持续、高强度投入,同时公司具备前的战略眼光,通过收并购提前布局,最终带来了领先全球的产品选代速度:
(2)注重技术复用性,让研发投入落到实处:公司在前期收并购布局时也曾遇到过错失移动终端的失误,但公司将前期投入复用到边缘计算领城,并带来了智能驾驶、机器人等新的业务机会,研发投入始终累积:(3)重视通用性,引入生态其建:公司在图形计算领城做深做专后,大力扩展应用领城,并持续降低开发者的使用门槛,高通用性、低门槛带来的是生态共建飞轮,进而形成了坚实的护城河。
上市以来收入成长超 160 倍,市值增长超 2700 倍
公司是全球领先的 GPU 算力龙头。公司于 1993 年由 Jenson Huang(黄仁勋)及来自于 Sun Microsystem 的两位工程师 Chris Malachowsky和Curtis Priem 创立,专注图形计算芯片的设计与研发,公司经历了起步积累、困境反转、转型升级和快速成长四个阶段,并成长为全球 AI 算力领军,根据 Garimer 预计,公司在全球 AI芯片市场的市占率最高已经达到 90%。
基础芯片层面,公司基于 GPU 技术路线,道过自研+并购形成GPU+CPU+DPU 的三芯布局:
(1)2000年推出全球首款 GPU以来不断进行选代升级,目前 GPU 领城产品涵盖消费级、工作站级、移动级到高性能计算的多种类型,即将在 202402出货的H200TensorCore GPU 基于 NVIDIA Hopperīm 架构,FP16 下算力达到 989TFLOPS,同时是首款提供HIBM3e 的 GPU,以每秒 4.8 TB 的速度提供 14IGB 内存,与前身 A100 相比容量几乎翻
倍,带宽增加 2.4 倍,针对 GPT-3 模型的推理性能是 A100 的 18 倍;(2)2020年收购 Mellanox 后推出的 BlueField DCU 能够有效减少 CPU 负荷,提升整体系统性能,BlueField-3 DPU 与上一代相比,具备2倍的网络带宽、4倍的计算能力和儿乎5倍的内存带宽,能够以高达8倍的速度运行工作负载,同时降低TCO 并提高数据中心能效;
(3)2021年推出的自研 Grace 系列 CPU 超级芯片基于 ARM 9 架构设计,相较于现有数据中心使用的 x86 CPU,运行微服务的速度快23倍,内存密集型数据处理性能快 2倍,在多个技术计算应用上运行流体力学计算工作时速度快19倍;为了进一步满足巨型人工智能和高性能计算工作负载的需求,公司还发布了将Grace CPU和Hopper GPU 封装在一起的 Grace Hopper Superchip,以及将两个 Grace CPU 在同一款 PCB 上互联的 GraceSuperchip。
报告共计:34页
精选报告来源/公众号:海选智库
本文仅供参考,不代表我们的任何投资建议。海选智库整理分享的资料仅推荐阅读,如需使用请参阅报告原文。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。