赞
踩
自2022年末ChatGPT爆火后,各大通用大模型如雨后春笋一般涌现了出来,进入了公众的视野,其中不乏国内自研的著名大模型,例如文心一言、GLM、通义千问等。
在通用大模型这个赛道上,可谓是“money is all you need”。
根据OpenAI的信息,在ChatGPT训练阶段就消耗了320万美元(约合2300万RMB),并且其中使用了28万的CPU核以及10000张GPU。
这样的开支和设备需求,随便拿出一个对于企业来说都是巨大的门槛。
除开门槛限制、通用大模型的竞争更像一个“广撒网”式的市场布局。
LLM早在2020年前后就有诸多国内外知名厂商进行布局,但不得不承认,ChatGPT是其中商业化和应用落地做的最好的,即使在其出现后不到几月就被各种其他大模型在性能和精度上超越。
总体来看,在通用大模型上,将逐渐会出现寡头垄断的态势,因为通用大模型的产品同质是无法避开的。
最开始少数头部AI厂商先入局,快速收割大批用户以及对应的交流语料信息,从而实现降本增效,压低Token价格对后续进入厂商形成压力,这也是我们在最近的ChatGPT4.0 Turbo发布会上看到的。
而中国的各大头部企业也在ChatGPT后快速布局通用大模型,也正是为了在市场上拔得头筹。
即使在最开始对标ChatGPT时,在评价上不乏嘲讽,但从目前态势来看,未来中国的大模型竞争也将稳定于少数头部企业。
正如上述所说,通用大模型是一个只有头部企业才能入局的“大逃杀”,但“通用”本身也是其自身的弱项:现实是高度专业化的。
而各大通用大模型,在落地到具体场景时例如心理咨询、金融、医疗、交通等,则显得过于不专业。
其训练集上存在大量的噪声,即有偏见和错误的网络信息,在对接专业任务时显得针对性和精准度不够。
类比来说,通用大模型就像一个博览群书的普通人,但专业场景下需要对专业知识精通的学者,即使其在其他方面稍为逊色。
在专业场景上,企业往往拥有大量的行业数据,但通常没有算力和技术可以自己训练一个千亿参数级别的模型。
由此“微调技术”成为了行业大模型构建的首选,我们可以看到大量的行业大模型在通用大模型的基础上进行微调,从而开枝散叶。
在行业大模型上,我们可以看到企业在从以模型为中心到以数据为中心,毕竟在当前Transformer主导的大模型架构下,除非有更创新的架构,再卷模型参数大小似乎不太明智。
而数据的重要性必然是越来越大的,也是更有应用场景的,特别是在同质化模型的竞争中,谁拥有独特的数据,谁就能在用户体验上出彩。
在未来通用大模型或将成为一种基础设施,而基于通用大模型+专业数据的模型微调范式将为成为对接下游任务进行商业化的一大利器。
纵览前文,我们可以发现:
如果有大量的通用数据和专业的GPU集群,那么可以去卷通用大模型赛道
算力不足,但有相当多的垂类数据,那么可以去卷行业大模型
但对于想抓住大模型时代机遇的普通人来说,要算力没算力,要数据没数据,两条路似乎都被堵死了。
幸运的是,还有Agent,并且可以说,Agent才是大模型时代的最终解决方案。
根据OpenAI的Lilian归纳的Agent定义,一个agent与传统的大模型最大的不同是:它更像一个人,有着计划、记忆和使用工具的能力。
在Agent的开发和落地中,关键的不是大量的预训练和基于行业场景的微调,而是对具体场景的理解,以及构建其交互逻辑,而这是我们普通人的优势。
因为我们本身就每天都在这些场景中人为交互,只是现在我们要加入一个agent做同样的事,但能做的更好。
ChatGPT虽然是现象级的产品,但其还不足够像一个人。
比如问它情感问题时,它只会冷冰冰地给出几条建议并推荐去看心理医生、向它大吐苦水时,也只会分点列出建议。
此外它也不会打趣、没有情绪以及永远不会主动对话。ChatGPT足够正确,非黑即白,而现实人们往往不期待那么正确的回答。
对于普通人而言,对场景的认知是最大的竞争力。
从openAI的gpts中就可以看出,普通人如何基于场景开发出独一无二的agent,并成功投入到具体场景的应用。
在算力上则可以通过API来降低限制,一切需要的只是创造力和场景认知。
在大模型时代,个体导向的应用更加突出,隐私问题变得更加重要。Agent的出现使得个体隐私保护成为关注焦点。
Agent作为个性化智能系统,人们更希望它能够记住个体的喜好、聊天风格甚至一些隐私问题,同时拥有自己的性格和情感表达方式。
例如,在情感陪伴的场景中,人们将Agent塑造成自己的聊天伙伴,参与社交生活,并希望其不满时会有小情绪、高兴时有自己的表现。
人们希望可以将一个角色复刻下来,成为自己的聊天伙伴,并参与到自己的社会生活中。
在这一过程中,需要对场景有着丰富理解的人参与其中,并创造好整体的交互逻辑,这一点正是普通人的竞争点。
未来大模型的落地方向将更加偏向私有化,甚至出现千人千面的Agent态势,而这一切都离不开个人对Agent的背景、逻辑、私有数据的良定义。
或许不远的将来,提示工程师这个设定就将被Agent工程师取代了。
但也必须提到,虽然普通人有着足够低的门槛来迈入Agent的创新赛道,但面对大量的竞争和产品同质化,如何打造富有特色的Agent仍然是一个挑战。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。