赞
踩
成熟的“格子衫”和年轻的“脸庞”,与开发者有关的大会总是少不了这两种元素,Create 2024百度AI开发者大会也不例外。
过去几十年,层出不穷的编程语言、框架等新技术,把一代又一代年轻的脸庞,塑造为成熟的格子衫,软件应用开发的效率确实在提升,但却总是跟不上庞大而又繁杂的需求,似乎开发者将永远陷入在这样的循环。
直到大模型的出现。
“你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”百度创始人、董事长兼首席执行官李彦宏言之凿凿。
掷地有声。成熟的格子衫还在思考,话语有几分可信与其间难题,年轻的脸庞已经深信不疑,迫切想要听到该如何“说话”,才能成为新时代的开发者。
基础大模型的确炫人眼目,大部分人如今还沉浸在基础模型层面,但是时候把更多目光聚焦在应用层面,先是大模型等新技术为应用场景提供了新的可能性,接下来就是软件应用生态的繁荣,去推大模型的再次提升。
而百度正在做的事,就是扫平大模型和应用之间的障碍,这也是本次开发者大会,百度拿出的三大工具——智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。
“大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。”李彦宏表示。
正如李彦宏所言,过去一年,大模型足够让人侧目,例如百度文心大模型,从3.0版本到3.5,再到4.0版本的进化,在代码生成、代码解释、代码优化等通用能力方面,达到国际领先水平。
文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。
但仅靠大模型还不足以催生出新的业态,就像互联网起初只是一种技术概念,而互联网应用融入到千行百业的场景,造就了如今耳熟能详的互联网巨头。“他们”没有发明互联网技术,也没有在互联网的底层基础设施做文章,却是把互联网用得最好的代表。
百度为开发者提供的大模型,就像是过去的互联网,百度有动力也有必要,提供尽可能好的大模型,从而为大模型应用开发者打好基础。
可以想象,百度冲在大模型第一线,踩坑是免不了的。李彦宏也直言,百度“踩了无数的坑,交了高昂的学费”,得出了一些基于大模型开发AI原生应用的具体思路和工具,直接分享给行业。
第一是MoE。未来大型的AI原生应用基本都是MoE架构,这里所说的MoE不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,要针对应用的不同场景做匹配。
第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过SFT精调后的小模型,其使用效果可以媲美大模型。
“这就是我们发布Speed,Lite、Tiny三个轻量模型的原因。我们通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。”李彦宏说。
第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。
智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,还可以让不同的智能体互动,相互协作,更高质量地完成任务。这些智能体能力,反思、规划、自我计划的能力,百度已经开发并向开发者全面开放。
李彦宏表示,大模型和生成式AI,将彻底改变开发者群体。过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言。
与之相对应地,开发者的武器库也需要与时俱进,以适应新时代的软件开发体系,同时针对MoE、小模型、智能体这三大方向上,百度已经做好了“开箱即用”的工具。
AgentBuilder:最主流的大模型使用方式
首先是智能体开发工具AgentBuilder。智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。
以新加坡旅游局为例,打开文心智能体平台,创建页面有着零代码、低代码两种模式,新手可以直接选择“零代码模式”,用自然语言,几句话就能创建一个智能体,实现酒店查询、景点门票购买等服务能力,目前百度已经跟携程合作,提供了酒店、景点、票务等旅游服务工具。
新加坡之外,大连、沈阳等文旅类智能体也都在文心智能体平台上线,还有知识类、创作类、学习类、娱乐类等各式各样的智能体。
目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。文心智能体平台还为开发者们提供了流量变现的通路。除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体的相关能力,为开发者解决流量分发的后顾之忧,获得实打实的收益。
有分发,就会有数据反馈;有数据反馈,飞轮转起来,智能体就能够自主迭代,越用越聪明。文心智能体平台还上线了智能体的数据分析和问答调优模块,不久后还将有更多的新能力上线。文心智能体平台将通过分发-诊断-收益的数据飞轮,驱动智能体形成质量更优、流量更好、收益更大的正循环。
除了新加坡之外,大连、沈阳等文旅类智能体也都在文心智能体平台上线,还有知识类、创作类、学习类、娱乐类等各式各样的智能体,这些都能在AgentBuilder做出来。
AppBuilder:自然语言三步就能开发一个应用
AppBuilder提前封装和预置了开发AI原生应用所需的各种组件和框架,可以大幅降低开发门槛,不写一行代码,最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。
以游乐场排队助手为例,打开AppBuilder的开发界面,第一步先给应用起名“游乐场排队助手”,第二步填写角色指令,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等;第三步再插入需要的工具组件。这样,在零代码的情况下,一个应用就生成了。
从去年开始,百度用AI重构了百度文库,使它成为用户“内容生产的起点”。如今,在AppBuilder的支持下,百度文库新推出的智能漫画和智能绘本,更是把场景延伸到了更加有趣的跨模态创作领域。
在AppBuilder上面,百度也提供了一定的跨模态能力,开发者只需要给一段文字,或者几句话,就可以快速创建绘画类的应用,像漫画、儿童绘本等。百度文库最新推出的漫画生成和绘本生成功能,就利用了AppBuilder上提供的这类组件。
从行业视角来看,百度AppBuilder具备两个明显优势:
一是功能强大。依托文心4.0对指令的理解和遵循能力,百度AppBuilder能保证冷启动状态下就能达到一个不错的水平,不会因为效果差,再花很长时间去调优,大大降低了开发门槛。
依托检索增强技术RAG,在知识问答等典型场景,问答准确率和友好回复程度都达到了95%以上,大幅超越其他同类产品。AppBuilder还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的AI能力组件、大模型能力组件,还有百度独家开放的业务组件等55个组件。
此外,一些主流场景的第三方API,比如航班查询、论文查询等,百度也有提供,最新支持了自定义组件,客户可以直接对接自己专有的任何工具和数据。这些丰富的组件,共同支撑起了AI原生应用的高效开发。
二是简单易用。使用AppBuilder,只需三步即可快速创建应用、一键分发。百度也支持开源的SDK,方便大家进行二次开发。
ModelBuilder:高效低价生产模型
ModelBuilder是更适合专业开发者使用的工具,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT,从而能达到更好的效果。
为了方便专业开发者快速上手,ModelBuilder预置了最全面最丰富的大模型。包括了ERNIE3.5和ERNIE4.0旗舰版大模型,它适合通用的复杂场景,能力强大;
此外还有三个轻量级的大模型,Speed、Lite、Tiny;以及两个垂直场景的模型——ERNIE Character适合角色扮演,ERNIE Functions适合对话或问答场景中的外部工具使用和业务函数调用。当然也包括国内外第三方主流模型,总数量达到77个,ModelBuilder是国内拥有大模型数量最多的开发平台。
以小度添添AI机器人日程规划为例,背后调用了不同的模型。先是由小模型ERNIE Tiny执行了“模型路由”的工作——把晨跑中的天气问题,分配给了基于ERNIE Lite打造的精调模型,快速查询出了气温25度、天气晴朗这些信息;同时,又把更复杂的日程安排,分配给了性能最好的大模型——文心4.0,来计算一天各项事项安排。
ModelBuilder的关键是高效低价生产模型的能力。企业客户可以根据需要,兼顾效果、响应速度、推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,并且支持精调和Post-pretrain。
通过降维裁剪出来的模型,比直接拿开源调出来的模型,同等尺寸下,效果明显更好,同等效果下,成本明显更低。
大模型到了聚合生态力量的新阶段,无论是国内还是国外,头部厂商都在试图打造新的大模型生态,AI应用的繁荣不仅能够证明大模型的价值,也能够反过来推动大模型的再进化。
当AI应用大量被创造,越来越多的数据被生成和收集,模型有更多的机会学习到不同场景下的应用知识;规模化带来专用硬件的普及和性能提升,使得训练和运行大模型变得更加可行和高效;多样化的应用场景带来正向商业收益,商业成功将转化为AI应用和大模型的资源。
百度文心大模型正在走上这一条路,用大模型和AI应用的相互促进,实现大模型生态的正向商业循环。
李彦宏表示,文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。百度在芯片、框架、模型、应用这四层架构上有着全栈的布局,通过端到端优化,不断地把成本打下来,让更多人都可以高效、低价地用大模型来做AI应用,通过端到端优化能力,不断提高文心大模型和文心一言的效率。
“实战是大模型最好的训练场,庞大的调用量将给予文心大模型更多反馈,反向促进了文心大模型的能力提升,形成飞轮效应,进一步扩大文心大模型和国内同行的差距。”他说。
文心一言从去年3月16日首发,在一年零一个月的时间里,用户数突破了2亿,每天API的调用量也突破了2亿,服务客户数或者说企业达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。
百度一并发布了文心大模型4.0的工具版,用户可以在工具版上体验代码解释器功能,通过自然语言交互,就能实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效精准的支撑。
此外,创业者生态也是大模型的有生力量。去年5月份,百度启动了“文心杯”创业大赛,第一届“文心杯”创业大赛,收到了近1000支创业团队报名,百度为其中的15支优胜团队,提供了近亿元的投资支持,并且在技术、团队和资源上持续提供全方位扶持。
李彦宏在现场宣布,第二届“文心杯”创业大赛正式启动,本次将扩大项目筛选范围、设置分赛场,面向全球市场及高校学子,招募创业创新团队。
只要创业方向是AI原生应用,都可以在大赛官网报名参赛,同时百度也加大了对创业者的支持力度,提供更充足的投资资金、更丰富的业务资源,还首次设立了“特别大奖”,特别优秀的项目将有机会获得最高5000万人民币的现金和资源支持。
无论是成熟的“格子衫”,还是年轻的脸庞,都是中国大模型产业的一分子,百度通过AI应用开发三大“神器”,展示出了一幅通向大模型产业未来的道路。这条路,有百度,也有千千万万的开发者群体。
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
保证100%免费
】123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。