当前位置:   article > 正文

这个全面对标 OpenAI 的国产大模型,性能已达 90% GPT-4_国内平替openai大模型

国内平替openai大模型

中国版的 OpenAI 在哪?

自 ChatGPT 一夜爆火以来,追赶 GPT-4 成为全球大模型创业者的目标,而在中国掀起的「百模大战」里,每一个中国 AI 从业者都想成为上述这个问题的答案。

今天上午,在智谱 AI 技术开放日上,智谱 AI 正式发布新一代基座大模型 GLM-4 且全量上线迭代功能,再次证明了其是目前国内唯一一个有能力全面对标 OpenAI 的大模型公司。

在这里插入图片描述
去年 10 月,智谱 AI 宣布累计获得超 25 亿人民币融资,是国内唯一一个估值破百亿的大模型独角兽。

翻开一连串投资方的名单,其中不乏美团、阿里、腾讯等互联网大厂,亦或者红杉、高瓴等多家一线投资机构,堪称集齐了中国投资界的半壁江山。

过硬的技术实力和融资能力,充分展现出智谱 AI 与 OpenAI 「划道对峙」的决心和潜力。

对标 OpenAI,发力 AI 大模型

本次发布会正式发布了新一代基座大模型 GLM-4,比上一代提升 60%,支持更长的上下文处理,多模态能力更强,推理速度更快,并发能力更强,同时降低了推理成本。

作为一款中英双语对话模型,GLM-4 的基础能力(英语)在众多基准测试中取得了优秀的成绩,平均水平已经达到 GPT-4 的 90% 水平。

在这里插入图片描述
在指令跟随能力(中英)上,GLM-4 的表现在多个领域都接近 GPT-4 的 90% 水平,在中文对齐能力上则是遥遥领先,专业能力、中文理解、基本任务、数学计算等方面都大幅超过 GPT-4。

在这里插入图片描述
更长的上下文长度可以帮助模型更好地理解输入数据的含义和上下文,从而更准确地预测输出,提高泛化能力。从 32K 提升至 128K 上下文窗口,GLM-4 单次可处理 300 页文本。

且 GLM-4 在总结、信息提取、复杂推理以及编写代码等应用场景上表现更佳,基准测试成绩再次超越了 GPT-4。以此前热门的「大海捞针」(128K)的测试活动为例,GLM-4 甚至能够做到百分百精准召回,达到了 128K 内全绿的惊人效果。

另外,GLM-4 的对标也延伸到了文生图领域。现场发布的各项基准测试成绩显示,智谱 AI 旗下的 CogView3 交出的成绩单几乎媲美 DALL·E 3,整体的效果也普遍超越了开源的 Stable Diffusion XL。

例如,CogView3 生成的「西兰花下面的斑马」图中,整体的画面控制十分精准。继续「上强度」挑战更复杂的场景,让它生成一只脸上涂着霓虹绿、霓虹橙还有亮颜色颜料的波美犬时,可以看到,生成图对于颜色场景的还原度还是挺高的。

在这里插入图片描述
临近演讲中场,本次发布会的另一重头戏正式推出——GLM-4 All Tools。得益于 GLM 模型强大 Agent(智能体)能力,GLM-4 能够根据用户意图自主理解、规划复杂的指令,自由地调用各种工具,如 WebGLM 搜索、代码解释器等,支持完成各项复杂的任务。

只需一个指令,GLM-4 All Tools 就能自动分析指令,并结合上下文选择决定调用合适的工具。上到生成可爱小狗、生成复杂代码,下到 PPT 生成、文件处理、数据分析、网页浏览等,只需在对话框中输入你的想法,它都能实现。

在这里插入图片描述

值得一提的是,GLM-4 All Tools 的网页浏览功能实现了模型自行规划检索任务、自行选择信息源,以及自行与信息源交互的大升级。

例如,当你提出要参加 2023 年 CCF 中国开源大会,并询问当天当地天气时,它会先联网查询 2023 年 CCF 中国开源大会的日期地点,然后再查询当天的长沙天气,且网页浏览的答案准确率也大幅度超越 GPT-4 ALL Tools。

此外,智谱 AI CEO 张鹏重磅宣布,基于 GLM 模型的强大能力,GLMs 已经正式上线。体验地址入口

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/469566
推荐阅读
相关标签