木道寻08

这个屌丝很懒，什么也没留下！

热门标签

AI 大模型算力芯片产业深度分析 2024_ai 算力大模型建设方案

作者：木道寻08 | 2024-08-07 06:12:48

踩

ai 算力大模型建设方案

算力需求爆发拉动芯片量价齐升

ChatGPT热潮席卷全球。ChatGPT（Chat Generative Pre-trained Transformer）是由OpenAI于2022年12月推出的对话AI模型，一经面世便受到广泛关注，其2023年1月月活跃用户达到1亿，是史上月活用户增长最快的消费者应用。在问答模式的基础上ChatGPT可以进行推理、编写代码、文本创作等等，这样的特殊优势和用户体验使得应用场景流量大幅增加。

1、▲芯片需求=量↑ x 价↑ ， AIGC拉动芯片产业量价齐升

1）量：AIGC带来的全新场景+原场景流量大幅提高。① 技术原理角度：ChatGPT基于Transformer技术，随着模型不断迭代，层数也越来越多，对算力的需求也就越来越大；② 运行条件角度：ChatGPT完美运行的三个条件：训练数据+模型算法+算力，需要在基础模型上进行大规模预训练，存储知识的能力来源于1750亿参数，需要大量算力。

2）价：对高端芯片的需求将拉动芯片均价。采购一片英伟达顶级GPU成本为8万元，GPU服务器成本通常超过40万元。支撑ChatGPT的算力基础设施至少需要上万颗英伟达GPU A100，高端芯片需求的快速增加会进一步拉高芯片均价。

2、ChatGPT的“背后英雄”：芯片，看好国内GPU、CPU、FPGA、AI芯片及光模块产业链

1）GPU：支撑强大算力需求。由于具备并行计算能力，可兼容训练和推理，目前GPU被广泛应用于加速芯片。看好海光信息、景嘉微。‍

2）CPU：可用于推理/预测。AI服务器利用CPU与加速芯片的组合可以满足高吞吐量互联的需求。看好龙芯中科、中国长城。‍

3）FPGA：可通过深度学习+分布集群数据传输赋能大模型。FPGA具备灵活性高、开发周期短、低延时、并行计算等优势。看好安路科技、复旦微电、紫光国微。‍

4）ASIC：极致性能和功耗表现。AI ASIC芯片通常针对AI应用专门设计了特定架构，在功耗、可靠性和集成度上具有优势。看好寒武纪、澜起科技。‍

**5）光模块：**容易被忽略的算力瓶颈。伴随数据传输量的增长，光模块作为数据中心内设备互联的载体，需求量随之增长。看好德科立、天孚通信、中际旭创。

1. 算力需求爆发拉动芯片量价齐升

AI计算需要各类芯片支撑

算力需求爆发，芯片量价齐升

AI服务器为算力载体

CPU、GPU、FPGA、ASIC、光模块各司其职

1.1 人工智能四层架构，芯片为底层支撑

1.2 人工智能不同计算任务需要各类芯片实现

1.3 ChatGPT流量激增，为AI服务器带来重要发展机遇

1.4 AI服务器快速增长，大力拉动芯片需求

1.5 AI服务器芯片构成——CPU+加速芯片

1.6 CPU擅长逻辑控制，可用于推理/预测

1.7 服务器CPU向多核心发展，满足处理能力和速度提升需要

1.7 GPU高度适配AI模型构建

1.8 FPGA：可通过深度学习+分布集群数据传输赋能大模型

1.9 ASIC可进一步优化性能与功耗，全球巨头纷纷布局

国内外ASIC芯片龙头布局

随着机器学习、边缘计算、自动驾驶的发展，大量数据处理任务的产生，对于芯片计算效率、计算能力和计能耗比的要求也越来越高，ASIC通过与CPU结合的方式被广泛关注，国内外龙头厂商纷纷布局迎战AI时代的到来。

1.10 数据传输速率：容易被忽略的算力瓶颈

1.11 数据传输核心器件：光模块

2. 技术创新引领本土产业链弯道突围

国产服务器CPU发展之路通过CHIPLET布局先进制程，服务器芯片广泛应用存算一体打破“存储墙”限制，实现降本增效.

2.1 服务器CPU需求增长，国化产三条发展路线

2.2 未来算力升级路径：CHIPLET、存算一体

近期CHATGPT的兴起推动着人工智能在应用端的蓬勃发展，这也对计算设备的运算能力提出了前所未有的需求。虽然AI芯片、GPU、CPU+FPGA等芯片已经对现有模型构成底层算力支撑，但面对未来潜在的算力指数增长，短期使用CHIPLET异构技术加速各类应用算法落地，长期来看打造存算一体芯片（减少芯片内外的数据搬运），或将成为未来算力升级的潜在方式。

2.3 CHIPLET是布局先进制程、加速算力升级的关键技术

Chiplet异构技术不仅可以突破先进制程的封锁，并且可以大幅提升大型芯片的良率、降低设计的复杂程度和设计成本、降低芯片制造成本。Chiplet技术加速了算力升级，但需要牺牲一定的体积和功耗，因此将率先在基站、服务器、智能电车等领域广泛使用。

2.4 CHIPLET已广泛应用于服务器芯片

2.5 存算一体：打破“存储墙”限制，技术迭代演进

2.6 存算一体：更大算力、更高能效、降本增效

存算一体就是存储器中叠加计算能力，以新的高效运算架构进行二维和三维矩阵计算。存算一体的优势包括：

（1）具有更大算力（1000TOPS以上）

（2）具有更高能效（超过10-100TOPS/W），超越传统ASIC算力芯片

（3）降本增效（可超过一个数量级）

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】