煮酒与君饮

这个屌丝很懒，什么也没留下！

热门标签

中国大模型的落地DNA，写在这个双螺旋结构里

作者：煮酒与君饮 | 2024-08-14 08:19:43

踩

随着大模型的飞速发展，行业各界对大模型的核心疑问，已经从“有没有大模型”，转变为积极投入建设之后，中国AI产业如何实现大模型落地？巨大的建设投资应该如何获得确定性、可持续的回报？

事实上，中国AI最强的特征一直是落地。

技术落地的一个重要指标是技术密度，即一项技术在社会和经济中的普及程度和应用密度。过去几年里，AI技术已经在中国的农田、工厂、港口、矿山、校园、城市等遍地开花，是全球其他地区都极少见到的景象。

产业革命的发生不可能一蹴而就，拥有大量业务场景和AI落地经验的中国，也应该是大模型落地的前哨站。

果不其然，外界对中国AI和大模型落地的疑问与好奇，已经可以在文心的最新进展中，得到解答。

7月6日，在2023世界人工智能大会（WAIC）上，百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰，解读文心大模型3.5版核心技术，同时发布了飞桨生态最新进展，首次披露了飞桨深度学习平台最新数据，阐述人工智能产业模式。

文心和飞桨的协同发展，组成了一个双螺旋结构，读懂这个DNA 片段，可以更清晰地理解中国AI技术持续走向落地的方法与路径。

一、产业AI的无形之墙

一个技术走向产业，有三个因素构成了影响其市场格局的制约点：一是技术领先性，二是市场需求度，三是产品可靠与可用程度。

大模型技术的领先性和市场需求度，自然毋庸置疑，那么产品能否经受得住产业用户的考验呢？中国AI场景多、落地早、实践多，所以已经可以清晰地看到一堵产业AI的无形之墙，各行各业普遍存在的“三高”要求，是大模型落地所必须跨越的挑战：

能力要求高。一些IT基础好的产业会率先应用AI、落地大模型，但这些领域往往有着复杂的业务场景，以及使用多年的传统算法，因此产业对AI大模型的基础能力，要求会比较苛刻，超出现有技术手段，才有升级替换的必要性。

专业性要求高。通用大模型进入垂直细分的业务场景，会面临非常复杂的业务状况，要注意哪些问题和细节，需要哪些数据，目标是什么，需要大模型能够像行业专家一样，掌握专有知识和行业Know-How。

开发成本高。行业场景的庞杂和差异化广泛，大模型落地需要有针对性的训练、精调，而很多行业和企业缺乏充足的IT人才、算力资源等来进行定制开发，延缓了大模型落地的速度。

“三高”要求制约着AI技术落地，这也使得大模型走向产业，还处于初级阶段。

二、中国大模型的强落地范本

凿穿产业AI 的围墙，需要筑重器。在世界人工智能大会上，王海峰分享了文心大模型3.5的核心技术创新。

与文心大模型3.0版本相比，文心大模型3.5版本在效果、功能、性能上全面提升，实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等能力升级。

更值得关注的是，文心大模型在应用层面，展现出了挣脱制约、指向落地的一系列方法，可以成为产业示范。

文心大模型3.5的几大技术创新，就满足了产业各界对大模型的三种强期待：

一是对先进生产力的期待。

归根结底，大模型要可靠、可用，为行业提质增效。文心大模型3.5的两大升级点，就着眼于此：

首先，基础模型升级，基于飞桨加快模型迭代，提升模型效果和安全性，模同时，百度文心大模型研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术，使模型效果及场景适配能力进一步提升。

此外，文心大模型3.5的逻辑推理提升，在语义理解、数学计算、代码生成等领域表现更好，这些任务是实际业务中高频出现的。王海峰举了个例子，百度每天有大量工程师在写代码，文心一言发挥大模型的代码生成能力，可以更好地帮助工程师提升写代码的效率，切实提高生产力。

二是对行业专家的期待。

大模型需要与行业场景适配，解决业务中更具专业性的实际问题，已经成为共识。此次3.5版本，就通过“精调”+“知识点增强”两大技术创新，让大模型具备行业专家一样的专精能力。

有监督的精调技术，可以针对性地适配业务场景，让结果更加可靠，从而更好地满足业务场景对模型效果和安全性的需求。知识点增强技术，则在此前的知识增强和检索增强的基础上，为大模型注入更具体、更详细、更专业的知识点，显著提升大模型对世界知识的掌握和运用，更好地完成专业任务。比如在生成报告时，文心大模型就能够对用户输入的查询、问题等进行分析理解，并解析生成答案所需要的相关知识点，生成更匹配业务特点的内容。

三是对丰富应用的期待。

智能手机中丰富多彩的应用，是移动互联网产业繁荣的前提。用户使用大模型也需要多样、丰富、易用的各种应用工具，这就需要插件机制来满足。

文心大模型3.5新增的插件机制，可以扩展大模型的能力边界，细致高效地应用于各类场景。比如文心一言的长文本摘要和问答插件ChatFile，支持超长文本输入，可以在办公场景下，形成会议议题、摘要及总结等关键信息，帮助提升工作效率。

王海峰也表示，文心一言将发布更多优质的百度官方和第三方插件，让用户能够更好地应用文心大模型，同时也将逐步开放插件生态，帮助开发者基于文心大模型打造自己的应用。

随着大量优秀的开发者和软件工程师，基于文心大模型来打造专属插件，不仅大模型的可用性和产业适配性会进一步提高，所带来的应用市场空间也是巨大的。

文心大模型3.5的升级曲线，紧密贴合产业期待。从中可以看到，文心大模型时刻准备着落地千行百业。

三、大模型落地需要可持续动力

仅有大模型还不够，王海峰提出，在文心一言这类大模型产业落地的进程中，可以采用“集约化生产，平台化应用”的模式，即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来，通过低门槛、高效率的生产平台，为千行百业提供大模型服务。

文心大模型能够率先卡位在大模型落地的关键位置，离不开背后的另一条上升曲线：飞桨的联合优化。

飞桨对文心的全面赋能，有四个层面：

首先，飞桨支撑大模型开发、训练和推理部署，全面提升大模型落地效率。大模型的训练、迭代要消耗大量训练成本、训练时间，经过飞桨与文心大模的协同优化，最新升级的文心大模型3.5的模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

其次，文心大模型成为飞桨模型库的重要组成部分，通过飞桨平台进行精调、推理部署，就可以有效支持千行百业的应用，降低行业获取大模型门槛。

再次，飞桨提供了全流程产业化工具与平台，解决大模型开发中的卡点、堵点，比如模型体积大、训练难度高、算力消耗大等，更好地满足企业开发应用大模型的需求。

此外，大模型落地产业离不开人才，飞桨已经凝聚了750万开发者，也支持了大量企业产生了大量的模型，为中国AI培养了大量新型人才，是大模型落地的有生力量。

可以看到，飞桨的技术和生态积累，正在为文心大模型走向产业，注入了源源不断的动力。

四、中国AI

凭借这样的DNA落地生根

在大会现场，王海峰也展现了文心一言在办公、会议、编码等场景的应用。可以说，文心一言已经有了丰富的新落地场景，这种强劲的落地表现，应该能够打消外界对中国大模型可持续发展的担忧。

从文心与飞桨组成了双螺旋结构的DNA，从中可以看出中国AI以实用为先，以产业为向的底色，中国大模型产业也开始呈现出这样的发展趋势：

1.低门槛。通过各个端口的技术创新，形成了AI技术全面低门槛化的特征，让模型的开发、获取和应用，都更加便捷、易得。

2.高效率。芯片、框架、模型、应用的全栈协同，带来了效率持续增长的乘法效应，大大加快了模型的落地速度。

3.通行业。AI开发、训练、部署、应用的全链路得到越来越饱满的支撑，“集约化生产，平台化应用”让大模型更适配产业和行业的现实需要，赋能产业智能化。

落地成为中国AI的DNA，大模型也不例外。以大模型为代表的AI技术和先进生产力在各行各业落地生根，这是为什么智能革命一定会发生在中国。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/煮酒与君饮/article/detail/978896