当前位置:   article > 正文

中国大模型落地应用案例集(2023)

2023大模型落地应用案例集 下载

来源 | 中国信通院华东分院、数据观

近日,中国信通院联合上海人工智能实验室成立的大模型测试验证与协同创新中心牵头,首次面向全国范围征集全行业优秀应用实践,并形成《2023大模型落地应用案例集》(以下简称“《案例集》”)。

作为首部聚焦落地应用的权威研究成果,《案例集》全面展示了大模型前沿技术和发展成果,推动了大模型为代表的人工智能技术赋能社会经济高质量发展。经专家组的多轮评审,共52个各自领域的典型大模型技术落地应用成功入选。

2022年底ChatGPT的横空出世,引爆了国内外大模型的热情,各行各业的创业者已经集结在十字路口蓄势待发。

从国内市场来看,目前人工智能(AI)大模型已经在各行各业“落子不断”。据公开资料不完全统计显示,国内大模型的发展路径是“通用+垂直”两条腿走路,其中垂类大模型落地速度最快。《案例集》显示,有近65%+的AI大模型是垂直大模型。

趋势已然,大模型技术突破代表了AI发展的一个重要里程碑,下面笔者将梳理中国从业者构建的“底层原创技术-中层基础模型-上层行业应用”的大模型图鉴。


PART 1、大模型领域中国学者的技术贡献

391fa4732d3a44c1d3a7e51e23f3aa7a.png

图注:ResNet的四位作者分别是:何恺明、张祥雨、任少卿、孙剑

2016年,来自微软亚洲研究院的四位学者提出深度残差学习(ResNet),解决了深度网络的梯度传递问题。要知道,2015年之前深度学习最多只能训练20层,ResNet之后,就可以有效地训练超过百层的深度神经网络。

44ce66eaf25d216ad8313cde243c2c45.png

2017年Google发布Transformer,它的出现打稳了AI大模型的“地基”,不仅“颠覆”了自然语言处理(NLP)中的机器翻译任务,而且还提供了一种新的思路来处理图像数据。

中国学者也围绕Transformer做了许多改进和完善,例如微软亚洲研究院联合西安交通大学推出LONGNET,将Transformer的序列长度扩展10亿+;京东探索研究院联合武汉大学提出全球首个面向遥感任务设计的亿级视觉Transformer大模型;阿里达摩院提出新的Transformer结构FMViT,大幅度提升AI模型精度与速度……

在大模型领域细数中国学者贡献,许多原创性贡献来自本土。已故的商汤科技创始人汤晓鸥(缅怀)在2023世界人工智能大会上,发表演讲时表示:在深度学习的大门上,我们按了18次门铃,取得了许多跨时代的突破。其中汤晓鸥提到了上海人工智能实验室领军科学家林达华,他当时设计的计算机视觉开源算法体系OpenMMLab,目前已经成为国际上最具影响力的视觉算法开源体系。值得一提的是,林达华也是书生大模型体系的重要贡献者。

京东探索研究院早在2021年年初就展开了大模型体系(超级深度学习)的建设和基础研究,领导京东建设了中国第一个NVIDIA DGX Superpod天琴alpah-α超算集群。在此基础上,京东探索研究院的织女模型vega v2 在2022年登顶SuperGLUE榜首,一举超越同场竞技的谷歌、微软、Meta等业界顶尖企业;2021年研究院开发的大规模视觉模型ViTAE,在ImageNet Real的目标识别和MS COCO的人体姿态估计等权威榜单上均获得世界第一。

1244e939d68cde46300c9b15521fc5c3.png

图注:(上)2022年京东探索研究院发表论文《Self-Evolution Learning for Discriminative Language Model Pretraining》,提出自我进化学习方法,为vega v2大模型的设计提供核心思想;

(下)2021年京东探索研究院发表论文《ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias》,尝试将 CNN和transformer相结合。

因此,国内公司的 AI 大模型研发虽然比国外公司晚,但是发展却异常地迅速,其内在逻辑便是:本土企业和学者对深度学习技术的深入理解与创新。在大模型的底层技术已经固定的时代,他们靠着持续的探索和努力才能构建出秀丽的“上层建筑”。

在OpenAI发布ChatGPT之前,国内的一些企业就已经押注AI大模型技术:例如2021 年 4 月,华为云联合循环智能发布盘古超大规模预训练语言模型,参数规模达 1 000 亿;2021 年 6 月,北京智源人工智能研究院发布了超大规模智能模型“悟道 2.0”,参数规模达到 1.75 万亿;2021 年 12 月,百度推出 ERNIE 3.0 Titan 模型,参数规模达 2 600 亿,同期,阿里巴巴达摩院的 M6 模型参数达到 10 万亿,将大模型参数直接提升了一个量级。

到2023年,大模型继续火热,国内的AI大模型团队已逐渐拓展到视觉、决策领域,甚至用于解决蛋白质预测、航天等领域的重大科学问题,阿里、京东、oppo等大厂都有相应的成果。


PART 2、大模型应用拐点已至

图灵奖获得者Yann LeCun说过:AI大模型的技术都是公开的,算不上底层技术上的创新,如果你愿意一探究竟的话,可以发现它背后没有任何秘密可言。

但借着这些“过时”的技术,在中国拥有庞大的人才基数和数据集的情况下,可以发展出更适合本土环境和语境的大模型。

那么如何形象理解大模型?前科技部长王志刚从高维度表示,大模型,就是大数据、大算力、强算法。形象一些:大模型事实上就是算法、数据、算力上的有效结合。传统巨头在大模型领域的技术投入普遍都是在积极防御,而中国企业在非常积极地推动向应用中的落地。

目前,业界除了把AI大模型商业落地模式统分为 toB 和 toC之外,在市场划分上则遵循通用与垂直两大路径,两者在参数级别、应用场景等方面差异正在显性化。

通用大模型往往是指具备处理多种不同类型任务的AI模型,这些模型通常是通过大规模的数据训练而成,能够在多个领域和应用中表现出良好的效能。大家耳熟能详的几个通用大模型均来财力雄厚的企业:

1. 书生浦语开源大模型:由上海人工智能实验室研发,涵盖 70 亿参数的轻量级版本 InternLM-7B,以及 200 亿参数的中量级版本和 InternLM-20B,以及完整的开源工具链体系。InternLM-7B 在包含 40 个评测集的全维度评测中展现出卓越且平衡的性能,它在两个被广泛采用的基准 MMLU 和 CEval 上分别取得了 50.8 和 52.8 的高分,开源一度刷新了 7B 量级模型的纪录。

2. 昆仑万维天工大模型:“天工”是一个 AI 搜索引擎,一个对话式 AI 助手。“天工”拥有强大的自然语言处理和智能交互能力,能够实现个性化 AI 搜索、智能问答、聊天互动、文本生成、编写代码、语言翻译等多种应用场景并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。

3. 通义千问 2.0:由阿里云研发的超大规模的语言模型,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均比上代有显著提升。

4. MiniMax-abab:由科技创业公司MiniMax研发。据悉,“Max-abab”是文本、语音、视觉三模态的千亿参数大语言模型,在中、英文服务领域均已超过GPT-3.5 的水平。今年8月份,“MiniMax-abab”大模型通过了国家首批大模型服务备案,面向社会公众提供服务。

5. 言犀基础大模型:由京东科技研发,该模型融合了70%的通用数据和30%的数智供应链原生数据,具有更高的产业属性。

6. 百灵语言大模型:由蚂蚁集团基于Transfromer架构研发。该模型基于万亿级Token语料训练而成,支持窗口长度达32K,在主流推理类榜单中排名前列。据悉,蚂蚁百灵大模型已完成备案,基于百灵大模型的多款产品已陆续完成内测,正陆续向公众开放。

58c2e934e6b70af5eec52f90ebdd4033.png

这些通用大模型包含千亿甚至万亿参数,覆盖自然语言处理、图像识别、语音识别等方面的任务,已在知识问答、医疗咨询、娱乐领域、视频生成等数十个行业场景领域,展现出广阔的落地应用潜力。

与通用大模型相比,垂类大模型参数量相对较小。但是因为有一些行业的核心数据和业务系统的生产数据参与,所以在相应行业解决问题更为高效、直接。

从《案例集》来看,在金融、教育、医疗等领域,已经有不少公司发布了相应产品。

131796e810eff483c13deca65a4ccbd6.png

根据《案例集》入选案例的应用场景,垂类大模型更针对于企业级应用场景的垂直性和专业性要求,而在模型部署层面,更少的模型参数、训练数据意味着更少的成本,因此垂直应用领域有望实现“万模齐发”。

《案例集》公布的名单,也恰恰验证了目前垂类大模型发展的一些趋势:

1. 加注端侧、边缘侧应用。轻量化参数能让手机助手接入AI大模型能力。目前已有案例包括OPPO的小布助手、华为的智能助手小艺等等。

2. 更倾向于“解决方案”式的交付方式。由于垂类大模型接受了大量特定领域的数据和知识,因此可以基于领域知识生成更具深度的解决方案。例如ChatDD 新一代对话式药物研发助手,面向游戏行业的图像内容生成式大模型等等。

3. 大模型开始向多模态领域发展。多模态意味着丰富的数据形式,包含视觉、听觉和时序信息。对于大模型模型来说,这意味着可以从多模态中提取和学习更多维度的信息。类似于《案例集》中的单晶炉自动化工艺识别多模态模型,相信未来将会出现更多。

4. “通用+垂直”模型互相融通的态势。随着AI技术的发展,不同类型的模型之间的界限变得越来越模糊。例如,一些通用模型开始整合垂直领域的知识,而一些垂直模型也开始利用通用模型的技术来增强其功能。例如百川大模型在娱乐领域的应用。


PART 3、抢滩大模型未来:构建生态

对于AI大模型这种划时代的超级机遇而言,胜负不在于做出一个爆款应用,赚到几亿盈利,而在于,是否抓到了大时代的方向。

换句话说,当下的大模型竞争早已超过了技术的范畴,更多是一种生态层面的比拼,具体表现在有多少应用、有多少插件、有多少开发者以及用户等。谁能够率先围绕大模型构建生态,或者说谁率先融入生态,谁就能成为领先者。

大模型要想像电力一样输送给千行百业和千家万户,必然需要一个体系化的产业生态,构建这个生态需要一系列相互关联的因素,包括技术发展、应用场景、数据管理、伦理与法律问题、以及社会影响等。

在生态建构的路径上,目前企业可分为两派。一派将大模型接入原有的产品线,做升级和优化;另一派试图以大模型产品为中心,建构新一代的“超级应用”。而有些企业试图跳过这两种路径,多方面融入AI大模型生态。从《案例集》公布的大模型服务类案例,我们可以看到有些中国企业做了以下尝试:

765cf7350afd43131a64b68eee9b7b30.png

例如蚂蚁集团实现了一个大模型数据高效高质量供给平台,不仅可降低数据获取和使用成本,且保证来源合规,并能够有效提升数据质量、过滤风险数据保障训练安全;优刻得开发的AGI云上模型服务平台,能提供数据标准化整合、安全合规、提供算力等服务;上海道客研发的云原生大模型知识库平台能够帮助解决信息孤岛,以及定制个性化的私人语料库;泡泡玛特的AI 整合平台集成多个知名AI大模型,为用户提供一站式 AI服务……

这些大模型服务工具,在一定程度上能有效地解决“幻觉”、“道德”、“性能”、“数据合规”等当前AI大模型遇到的问题。更重要的是借助这些服务,可以建设规范可控的自主工具链,帮助AI企业探索“大而强”的通用模型,助力公司研发“小而美”的垂直行业模型,从而构建基础大模型和专业小模型交互共生、迭代进化的良好生态。

案例集具体内容如下

42b42ff10d6064f5732de27a10dedfe5.png

7f33542d4a4d93217e7da51138c59fc0.png

8e26906179dbe717c32bbd8f51631d13.png

aecd67f851a4a3c213d09e5e15d18896.png

18e0366e49686bf25936a985bbff31d0.png

fbedfd1116d01562d232de0a9c185759.png

40ba64578ee0c03a2020f1a09180e5f0.png

c8d74456991a2024486f208d86d2f60b.png

0a92d4a52b92a091b88a95669f0c65ca.png

eeeaba09ca7c886fb1a37d31dc211135.png

fabe55d43ac090fe3fc730f3c7e58b52.png

f455f24e95d8774a2b0ea7600b80b025.png

2dc6e1dfe8753796fdfc631ceebdbeef.png

fbef7f75c47019e36cd45e2b5e5281f4.png

90e7980c19d23d918961baa9d6dd0d28.png

d1ec6ba49fed135c4ea1eb3bc4d55d6a.png

bdfa4239f793147e3411e78a30ecd909.png

3b4efe0cdc8289f1505e1d644642e1b9.png

392aba641569ce1c7df32e80d402fbfc.png

599eb22bea83860b7db4d89c822e7f36.png

fcca3a0aa7e0c2107d009c544afba63d.png

73d29b21451c4576f9c146cfb360adc7.png

c8c1e1ec158d395cf73df93268abff37.png

b0f55359c89fdb6c6e90be034f0580a6.png

c060941405bf3b041112c559b7654ad7.png

fc773452a067435a7ca6e831eb39a31f.png

a37a94d0629f330ee77d4ffd28e78c8d.png

ac2478b86f568ed6d3cdad075beeb8cd.png

3d16b045b840973710671e4389f5339d.png

82ab01243ea1c63cf05ef1560bb7bf8a.png

0eba6b7c7bf291e9d3e5ac70676897b8.png

e4f9d5221c29000371c75842b7ea391e.png

e395c4e76bf451594cd54fec66146a6c.png

13c896c4b1dca17bff4c02108ca83ef9.png

86e9cf65eb9cd2b54327bbcb654c7e9e.png

a2611bfb43d1fd3e349e3f53307621ae.png

639ca523284a4a1062276a344d412d6f.png

b2edd67bcd2b54da1d02660ed5ee2887.png

b06a82ea24231263813646c46a21b84a.png

a00b5bfecc2c7c7d8e4b48a2d0704e7b.png

566428fda4a9cef4643d6cc2123ee172.png

b70dafca0139425545f361f3cbd48319.png

9743c83dc3d69b2d0ee7d74bfe96aa9f.png

e7b77751c1b24b60912c6612aaa199c3.png

cb4e965a296ea62e0b168bf74a1b1664.png

034c6f7c2964836c902e159ddf8fad70.png

b8de5cb4cd1ebb4ac8dccf8c439d91de.png

2997e64190eed00294069598e0cb9003.png

223f01ec0c152ae8b6e791ec4b234bf0.png

29d6dcfd765be561f5fcd345e228a274.png

ba8f38e19e292e0a8e426e422b594dfc.png

3f872b0f94ab77171780028a70433e72.png

41d1235e90384b407afe167d8a1a4ee8.png

4ae2e611ccd1771644dd49ff0f75ef10.png

d6906c5c569e5f449a6a58c84a49c345.png

58894d84f890bdc3146e44f9ecffd955.png

2fb67ffe8c4c251e035cd7cafd8cd232.png

aea9d76aa4ecf3b95cb85b74c2bfc5dc.png

42a7101c1db38057ca43c4ae4dcc704a.png

08d9bb31773b607ab130ce8244feb6d2.png

9db1e421e43e07f361c3e5675e1c4771.png

6c24f51f73f618976dfb0d279c8d7a35.png

4cbf201a7ac701c6bddb6380f0c7ced7.png

e3b2bbb38c211562b3a9cc5210b170fc.png

cb5a26813c868f6f8d45169b8f3c7340.png

a363548060630a08629ffcb2b724e9f7.png

d67d9c78f92e39c255c443e9196d398e.png

cfe39052b6620b7906538f18f7881653.png

70da18cc8ef1ed898a1b1edae82f961d.png

24c1137aada6e63eafac0fc9a8f2e52a.png

fb734ce823f92d6c8e99b37b07b36df5.png

f5afe5c71dc4658715f64abb7b17bc42.png

2922d770fe6f34ff0f2e1982a93acd6a.png

02dd4eb614bdb81b4583476b93064c8e.png

2a6d79cf70fd80bbf9ab1cf79963f29b.png

e7c8250ad7f2ac3eec32a7c5b7e8328a.png

a2f7461af7e1c73f29546a12859f88ff.png

a34e140a2134188c76e812c88840c254.png

0fd59b55f6410b8ae0de33d839cca691.png

6da0bb6ec6cf33372e1ef13084cfcffe.png

85891c0882e49930426bedd8197e3350.png

248fa12001f00cce7276a31730d9f4f3.png

3e5dacf9656ecbebae73027fb3cb4aff.png

eeae75d89b74e026b59ba445b09b687e.png

8ec1ec98af9f3eb56b64a300b9181d22.png

f379e6b9c6653c340cc1071849b11910.png

2eb27b9743d2db9461974b07099cf3f4.png

aa790f5e8afe0d34b4eff2ab52ba52c8.png

506058214b065c672b9baef78e91b27e.png

2b993ee887e476c2bc7f1a69864475de.png

3bca5b15fcdd161b7d5216b7de3e3771.png

9ebaf9dd982ca5a7c3890866e9339375.png

db6345db25fd3f1a0582eb7be4d7cf66.png

23ea55af8984aa58dc503617d887f338.png

3a8d688918d04dcba76a32ad502727c3.png

0d1fe34a3dc54876cae85e5b3238a687.png

2138bc54342ddf8327d7da573e725c04.png

5b12ba090c7d0937abc38ca8c71baa76.png

37db8a3c87cf175915a07121fc8cabc6.png

f7cbf3893e1fa425b1f8e7759483787c.png

3252823ae778389e05c658c61ab82171.png

598ee8d430f3a4ffa5bd68820c3b9415.png

669b37fd77d4fb3ab7875aa3286ad78f.png

40ecca70857f268d95510d3233f065b2.png

a93ea6814c509fd462aa5828b7f36f41.png

fd1fdd112c54de4dc41bcc081f20d09e.png

e6e7f633669dcd943ccc2adb01b34621.png

5d5885db08738079db86058bc59b581b.png

4b5e1efdcd40bc18b1bfb872f5b55c9f.png

4d624b45a269e394cedaf779b15cee09.png

9ca0153557ff3619a8dea9d4ee9d7f32.png

ec5643a63f23cd110c78a450df5dc9ad.png

9405f53076926dc54c26092b14298bd6.png

1036e022341cf2ad5c7cca50104977bd.png

cfe2704db67a9f6c3beb71f6aa9d127c.png

39c005b22650b7547a22edd4428dfacf.png

8339287d4c2eedc6f864dd05c329328a.png

98eaa19ad2ccd83059493938aa1f61b5.png

10ea9d3dd859e0970c0c1de5056b5f62.png

END

欢迎加入Imagination GPU与人工智能交流2群

3e6fc2d0f7fbb6cc634072f1774e1ad0.jpeg

入群请加小编微信:eetrend77

(添加请备注公司名和职称)

推荐阅读

对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数

ba3ccae807fc37e92f518cb68b77daac.jpeg

《RVfpga:理解计算机体系结构》3.0 版本更新上线


Imagination Technologies 是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/64212
推荐阅读
相关标签
  

闽ICP备14008679号