赞
踩
国内大模型发展趋势|6月份解读
大模型厂家集体亮相世界人工智能大会
秀肌肉
这两天在AI圈,世界人工智能大会(WAIC)在线上线下持续火热发酵。作为一年一度的AI盛事,此次大会无疑是各大AI厂商秀肌肉的最佳展示舞台。
根据WAIC官方数据,今年有500余家企业参展,市外企业和国际企业占比超过50%,展品数量超1500项,参展企业数、亮点展品数和首发新品数均创下了历史最高。
总体来看,大模型应用和基础设施成为此次大会的核心主题。
WAIC 2024 的八大“镇馆之宝”:阿里云通义灵码、联想YOGA Book 9i AI元启、基于蚂蚁百灵大模型的“支付宝智能助理”、商汤科技Vimi可控人物视频生成大模型、特斯拉赛博越野旅行车、智谱AI基座大模型、智能飞行器展示区,以及“十八金刚”人形机器人先锋阵列。其中,有一半都是大模型应用产品。
此外,在应用层,智能体发展趋势明显。从WPS AI 办公助手到百川智能AI健康顾问,从支付宝智能助理到腾讯智能体创建平台元器,AI Agent成为通用大模型走向各行业落地场景的重要抓手。
在AI Infra层面,算力焦虑是目前大模型发展普遍存在的问题,在国内,一方面受制于芯片断供影响,另一方面现有芯片无法释放其最佳性能。
国产芯片厂商摩尔线程宣布,其AI旗舰产品夸娥(KUAE)智算集群从当前的千卡级别大幅扩展至万卡规模,以全功能GPU为底座,打造承载万卡规模、具备万P级浮点运算能力的国产通用加速计算平台,为万亿参数级别的大模型训练提供平台支持。
在算力规模化难题上,无问芯穹推出全球首个千卡规模异构芯片混训平台,千卡异构混合训练集群算力利用率最高达到了97.6%。
无问芯穹采用“MxN”方案,M层是大模型,N层是各种国内外芯片,可以通过算子优化、自动编译、不同芯片耦合等技术一键部署模型,支持Qwen2、GLM4、Llama3、Gemma、Yi、Baichuan2、ChatGLM3系列等共30多个模型,以及AMD、华为昇腾、壁仞、寒武纪、燧原、海光、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡。
OpenAI断供,国产大模型一键“搬家”
6月底,OpenAI突然宣布7月9日起,将终止对不支持国家的API服务,包括中国在内。
这一消息可谓一石激起千层浪,这一决定意味着依赖OpenAI服务的国内开发者将无法继续使用其API。
对此,国内AI大模型厂商迅速作出反应,推出了各自的迁移方案。智谱 AI反应最快,智谱 AI针对OpenAI API用户推出特别搬家计划。
百度、阿里、360、零一万物、MiniMax、硅基流动等公司也紧随其后出台优惠政策,包括免费赠送Token、零成本迁移等,为国内开发者提供专属迁移服务。
OpenAI断供,一方面对哪些通过调用海外大模型API接口提供服务的套壳网站来说,无疑是毁灭性的打击。不过,另一方面,这一举措或许能进一步加速国产大模型的发展,在激烈的价格战竞争下,能获胜得只属于有实力的少数,也就意味着优胜劣汰的过程将会缩短。
周鸿祎在社交媒体上也表达了类似的观点,他认为,“OpenAI对中国地区停止服务只能加速中国自己大模型产业的发展,未必是一个坏事。”他解释道:“OpenAI的API无法调用,这逼着国内应用只能选择国产大模型,而国产大模型与GPT的差距已经逐渐缩小了。”
浪潮褪去,才能看清谁在裸泳。
Sora出现半年之际
视频生成大模型集中爆发
今年年初Sora炸裂出场,引爆全球对文生视频的关注与下注,各种文生视频产品如雨后春笋般涌现。
在国内,Sora出现半年之际,文生视频集中爆发。今年4月生数科技发布文生视频大模型Vidu;5月腾讯官方表示,基于DiT架构的混元大模型支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力;
字节跳动旗下的文生视频产品即梦已经上线,剪映版文生视频也在路上;6月快手自研视频生成大模型“可灵”开放公测,目前已有超过35万用户排队审核;商汤在今年WAIC上也推出了视频模型 Vimi,发力“人物”和“可控”两个难点。
国际市场上,文生视频竞争同样激烈。6月13日,Luma AI 官宣了自己的视频生成模型 Dream Machine,并提供免费使用API;Runway近期也宣布,其文生视频模型Gen-3Alpha向所有用户开放,每个月最少12美元即可使用。
视频生成模型已经成为大模型厂家的必争之地。
大模型应用新“爆点”——AI搜索
大模型具备强大的文本生成、语言理解、知识问答等核心能力,这些能力使得大模型能够有效地处理和理解用户的搜索请求,从而提供更加精准和丰富的搜索结果。
搜索与大模型的天然适配性,让一众玩家选择AI搜索作为大模型应用落地的第一站。
向左搜索老玩家,百度APP上线AI捏合摘要功能并推出简单搜索、周鸿祎为自家360AI浏览器和AI搜索代言;向右有一众AI原生搜索新势力天工、百小应、秘塔以及背靠腾讯生态的元宝等等,搜索领域重显当年“3SB”时期神仙打架的场景。
这些新兴的AI搜索在底层算法架构、交互方式以及用户体验上不断创新。它们通过多模态搜索、自然语言对话等功能,为用户提供更为精准和个性化的搜索结果。
目前,搜索被认为是跑出杀手级AI原生应用的关键锚点,虽然如今AI搜索商业模式仍不明晰,但未来仍值得期待。
字节跳动
6月12日,字节跳动旗下模型开发平台扣子推出扣子模型广场,打造在线大模型对比与评估系统。简单来说,通过让两个匿名大模型进行PK,开发者投票选出自己认为表现最好的模型。
扣子模型广场提供三种PK模式,包括“随机Bot对战”、“指定Bot对战”和“纯模型对战”三种。
目前,扣子已经接入了豆包、通义千问、智谱GLM-4、MiniMax、Moonshot、Baichuan等多个国内头部大语言模型,这些模型都可以参与PK。
不仅如此,用户还可以用扣子创建自己的Bot,并发布到扣子Bot商店、微信公众号、微信客服、飞书等等。
百度
6月28日,百度在WAVE SUMMIT 深度学习开发者大会上,正式发布文心大模型4.0 Turbo版本,其同步上线网页端和API接口,App端也将陆续上线。
据介绍,相较于文心大模型4.0版本,Turbo新版本应答速度更快、检索能力更强。
同时,飞桨平台发布新一代飞桨框架3.0 Beta版本,具备大模型训推一体、动静统一自动并行、编译器自动优化以及大模型多硬件适配等特色。
此外,百度智能代码助手Baidu Comate也迎来了重大更新,升级至2.5版本并更名为“文心快码”,正式成为百度“文心”生态体系中的新成员。
在AI应用的发展方向上,百度正在全面布局智能体。李彦宏在WAIC大会上强调,随着基础模型的日益强大,开发应用也越来越简单,其中,最简单的就是智能体,只要用“人话”把工作流说清楚,再配以专有知识库,即可做出一个很有价值的智能体,“比互联网时代制作一个网页还简单”。
他认为,医疗、教育、金融、制造、交通、农业等各行业领域,未来都会依据自己的场景和特有经验、规则、数据等等,做出各种智能体,将会出现数百万量级的智能体,形成庞大生态。
目前,百度APP已经上线智能体分发平台,未来搜索或将成为智能体分发得最大入口。
智谱AI
6月5日,在智谱AI Open Day上,智谱宣布,清言APP推出多智能体协作系统清流,可以轻松实现在同一个对话框中自由调用多种不同的智能体协同工作,让AI人人可用。
智谱AI在大模型商业化竞争中也率先迈向下一站,MaaS 2.0 大模型开放平台全线接入新模型;推出全新企业权益服务体系进一步降低大模型使用成本;推出一键微调功能,无需代码,仅用三步即可完成模型微调;AllTools 智能体 API,为开发者提供了⼀套工具,利用模型、工具和知识来执行复杂、多步骤的任务,轻松构建强大的 AI 助手。
此外,智谱还开源了GLM-4-9B,作为第四代的GLM开源模型,GLM-4-9B开源模型综合能力相比 ChatGLM3-6B 提升 40% ,全面超过 Llama-3-8B-Instruct,中文学科能力提升 50%,最高支持达 1 百万 tokens 长文本,支持多达 26 种语言,函数调用(Function Call)能力媲美 GPT-4-Turbo。首次开源基于 GLM 基座的视觉模型 GLM-4V-9B,多模态能力比肩 GPT-4V。
在今年的WAIC上,智谱宣布第4代智能AI编程助手CodeGeeX免费使用,论坛上,智谱AI CodeGeeX技术负责人郑勤锴发布了第4代CodeGeeX代码大模型CodeGeeX4-ALL-9B。
腾讯
6月,腾讯在AI搜索领域动作频频。
首先,QQ浏览器基于混元推出的“AI助手”迎来全新升级。此次升级主要是正式上线“AI助手”电脑端,同时提供“AI助手”双端全新入口,功能上支持用户用“小笔记”进行摘抄。升级后的“AI助手”将全面支持用户手。
紧接着腾讯宣布旗下大模型应用“腾讯元宝”AI搜索能力升级,上线深度搜索模式。
据介绍,更新到最新版本后,腾讯元宝将在AI搜索深度模式下对问题进行扩展,从深度和广度两方面,提供更结构化、更丰富的回答,并可同步生成内容大纲、思维导图及相关人物事件梳理,帮助用户全景式了解搜索内容。
在AI Infra方面,腾讯自研星脉高性能计算网络全面升级,升级后的星脉网络2.0搭载全自研的网络设备与AI算力网卡,支持超10万卡大规模组网,网络通信效率比上一代提升60%,让大模型训练效率提升20%。
这意味着,原来训练中某个计算结果的同步需要花100秒完成,现在只需要40秒;原来需要花50天训练的模型,只需要花40天。
值得注意的是,在WAIC大会上,腾讯开源全球最大的甲骨文多模态数据集,助推甲骨文研究加速数字化和智能化。
科大讯飞
6月27日,科大讯飞正式发布讯飞星火大模型V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。
据了解,讯飞星火V4.0基于全国首个国产万卡算力集群“飞星一号”训练而成。
讯飞星火V4.0七大核心能力全面升级,不仅在8个国际主流测试集中排名第一,领先国内大模型,并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现对GPT-4 Turbo的整体超越。
大会现场,科大讯飞董事长刘庆峰宣布,讯飞星火App安卓端下载量已经超过1.31亿次。
除了发布讯飞星火大模型V4.0外,还推出了首款星火智能批阅机。
星火智能批阅机基于星火大模型V4.0强大的底座能力,在对多学科、多题型作业进行智能批改的同时,可以即时生成多维学情报告,以便老师在作业讲评时进行分层辅导。
华为
6月21日,华为正式发布盘古大模型 5.0,在全系列、多模态、强思维三个方面实现升级。
全系列:盘古大模型 5.0 包含不同参数规格的模型,以适配不同的业务场景。
多模态:盘古大模型 5.0 能够更好更精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等更多模态。在生成方面,盘古 5.0,可以生成符合物理世界规律的多模态内容,让创新随心所欲。
强思维:复杂逻辑推理是大模型成为行业助手的关键。盘古大模型 5.0 将思维链技术与策略搜索技术深度结合,极大提升了数学能力、复杂任务规划能力。
在应用层面,盘古大模型深耕行业,已在30多个行业、400多个场景中落地,在政务、金融、制造、医药研发、煤矿、钢铁、铁路、自动驾驶、工业设计、建筑设计、气象等领域发挥着巨大价值,重塑千行万业
360
6月7日,360发布全新360AI搜索及360AI浏览器。
此次360AI搜索基于“我搜你看,你问我答”的定位,进一步通过思考模型、搜索模型、阅读模型、写作模型、追问模型5大场景模型协同工作,为用户提供多语言搜索、多模态搜索及多任务搜索,将搜索内容反馈从“模糊”变为“精准”,提升搜索效率。
同时,全新推出的360AI浏览器可覆盖论文图书、视频、音频、网页、图片六大明星场景,助力办公学习提升100倍速。
外此,360AI大会员体系正式上线,采用会员订阅模式,用户不用购买新电脑,即可享受AIPC的轻量化方案。据悉,360同步上线AI工具服务平台“360AI甄选”,目前已有200余款AI应用入驻。
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。