当前位置:   article > 正文

大智能:大数据+大模型+大算力_大数据 大模型 大算力 大智能

大数据 大模型 大算力 大智能

在近日举行的“2022中国人工智能产业年会”主论坛上,中国人工智能学会监事长、中国工程院院士蒋昌俊在报告中表示,人工智能的发展已经历了数十年的过程,大模型ChatGPT在今年春节前后突然出现,大家还没有来得及深度思考就已经“扑面而来”。

蒋昌俊

大智能的研究进展

科学技术的研究约分为两大范式,一是牛顿力学奠定了理论计算的范式,二是开普勒开启数据的范式。之后经历了实验归纳、理论的逻辑推演,以及计算模拟、最近的数据密集型科学发现等。特别是近来基于数据的科学发现,主要用大数据拟合高纬度复杂函数以发现其内涵规律与模式的过程,被称为第四范式。

人脑是利用过去的背景知识和感知的现行数据确定决策;大模型是通过学习模型适应下游任务以完成机器的决策。在这一过程中,大模型综合部分通用任务的结果,并且给下游任务较好的表征,类似于人脑中背景知识提供的经验,也类似于人脑在具有背景知识的情况下较快适应新环境。

传统模型一般规模比较小,比如专家系统、知识库等。它是具有一些知识推理的模型,少量的专有知识能在小算力的情况下通过集中式算法的处理,因此所能解决的问题也相对有限。而大模型不一样,在算力、数据和模型方面有着大规模的提升。它在海量的泛化数据中,在大算力的支持下通过分布式算法驱动,使其具有泛化知识的推理模型。

大算力的支撑导致大智能。超大规模模型参数的算法即超多层的神经网络,数据是超大规模的数据样本,算力是超大规模的计算范畴。在这样的条件下,我们对自然语言的理解与处理显然有着集聚效应。因此此次的大模型跃迁可以归结为大模型算法的优化,一方面提升数据的利用率,同时也缓解算力的需求瓶颈。这是我们从大模型、大数据中挖掘出复杂规律的方式。

大模型的优化经历了几个过程。首先是早期的统计语言模型,然后进入面向特定任务的神经网路嵌入式模型,再到基于深度学习的预处理模型。预训练模型为自然语言的处理提供了好的表征。ChatGPT是自然语言处理最新的衍生品。这一过程在一些具体事务中的表现,比如在美国高校的入学资格考试中其取得的平均成绩为中等水平。如同AlphaGo早期与人类的博弈一样,它可以进行自训练,无止境地提高自身水平。AlphaGo所拓展的空间远远强于人类,在博弈过程中的见识比人类更广。但反过来说,围棋毕竟是有限空间,在19×19的棋盘中下棋是有规则的。ChatGPT数据空间的样本是无限的,过程没有固定规则可言,所以它的问题更加复杂。在这一情况下ChatGPT能够接近人类的基本水平,令我们非常惊讶。

大模型里关键技术主要包括语言的生成、上下文的学习和世界知识。三种能力来自大模型的预训练过程、代码训练、指令微调,再基于人类反馈的强化学习。目前ChatGPT4已经出现,这一过程在学术界引起强烈的反响。比如杰弗里・辛顿对此一开始保持沉默,但最近他离开了谷歌并表达深度担忧。

卷积神经网络和循环神经网络是其中的关键技术,Transformer的过程被特别留意。ChatGPT的发展再到基础的模型、Transformer的优化,加上算力和数据的“给力”,使得这一次大模型的表现非常不一般。大模型关键技术还包括思维链,它将认知过程划分为若干阶段,每个阶段再进行细化和表征。思维链在研究认知行为的过程中起了非常重要的作用,就是将一个较大的问题划分为小问题,并且预测出思维过程给出提示。在大模型方面可以更好地利用语料数据库,给出更精确的推理。对于每个提示的输出思维过程,一定程度上能对模型的输出作出解释。

大智能的发展趋势

大智能包括三个方面——大模型、大算力和大数据。它的研究趋势之一是继续通过数据、算力和算法的规模,在变化的量变过程求得质变。在量变求涌现的过程中,在垂直方向可以看到数据、算法和算力的表现。一是高质量数据, 因为数据的质量非常重要;二是高效能算法和高效用算力,可以保证认知过程的准确性与精准性。在这些方面我们仍在不断地探索和研究,在数据方面通过多模态数据的采集提高数据效用。在算法方面,算法效力的提高是我们追求的目标;在算力方面,算力有效的效能行为也能有所推进和进展。

大模型的垂直化是大智能的第二个趋势。一个是领域基础模型,另一个是行业基础模型。比如受到关注的安全风控基础模型——当然这不光是在某个行业,而是相关行业都有的共性问题。如具体落在金融行业,其金融业务的基础模型是行业的基础模型。如同人类知识架构一样,在通用的知识基础上如何应用领域与行业的常识,这是垂直化的重要趋势。当然在这个过程中也面临了一些问题。比如产业现状是直接使用基础模型,往往会与场景上专业的应用需求有一定差距,它的问题就表现在缺乏行业的知识、使用的门槛比较高,部署相对比较困难。这是目前我们所面临的三大基础问题。

针对垂直化行业大模型的产业模式问题,一从社会化的分工入手,二从工业化的大生产入手,从行业任务一直囊括行业业务数据以及语料和知识。大模型平台相对应的是行业大模型、通用大模型和通用大数据,从数据中筛选出有效的知识和利用。所以总体而言,它的垂直化是全产业协同,从数据角度来看,包括静态数据、传输中的数据等数据共享机制。另外,行业大模型聚焦具体的行业属性,加速智能化升级。基础大模型的科研成果落地要有具体应用,从数据中获取知识是其共性的追求目标。

大模型面临的种种挑战

现在各大行业都在纷纷尝试建立各自的大模型。在垂直行业中,算力供给也面临挑战,一是需要实时更新,时效性的领域知识需要实时更新,需要全面满足多样性的服务类型,适应各自相关的业务需要。二是需要及时响应,特别是对一些突发性的计算任务,比如金融交易领域的风险控制往往较多面临突发性的情况,这时需要垂直领域的算力供给,要适应随需即用的特性。

在综合性算力供给方面,算力的汇聚包括从端上数据、边缘数据到云际间的数据。在基于算网的组合方面需要算网智能、供需的平衡、统一编排等,这些技术都需要予以加强。此外还要按需使用,如在智能推理、不同的工业互联网环境、远程医疗等都有不同需求。特别是在机动性强的领域,算力的专配非常重要。根据需求,可伸缩性、可扩展性生成定制化的算力供给。在这一过程中我们建立了方舱计算模式,将算力、算法和数据三合一,形成机动性强、供应性比较灵活的方式,这对整体性算网是非常重要的。

模型风险也是风险之一。模型风险就是要解决一些虚假性问题即去风险,这是进一步开发基础性模型的核心挑战之一。同时还包括安全性问题、数据风险、侵权等。数据的隐私将面临更加严峻的挑战,如何保护隐私问题是在大模型安全中必须考虑到的。此外还有安全中的多元风险,将算力、算法和数据叠加,其数据安全、系统安全和模型安全融合后的整体性安全问题,都是需要考虑的基础性问题。

大模型的发展趋势从安全化、可信可控的模型,单一行业向大模型的垂直行业、垂直领域不断去拓展,从而带来的社会化问题应该引起高度重视。总结而言,一是大智能研究进展是“丰富数据+扩大模型+增投算力”,从而生成“思维链+自注意力机制”这一关键性要领。二是大模型的发展趋势,从量变求涌现以及大模型的垂直化和大模型安全性的增强,这些问题必须予以关注。

(根据“2022 中国人工智能产业年会”报告整理,有删减)

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/635426
推荐阅读
相关标签
  

闽ICP备14008679号