IT小白

这个屌丝很懒，什么也没留下！

热门标签

GPT-4o 排第一，它排第二！国产 AI 终于有个能打的了_yi-large

作者：IT小白 | 2024-08-15 13:01:04

踩

yi-large

推荐 kimi 是因为它的搜索更方便，中文语境下使用更方便

昨天有几个新闻，一个是黑寡妇发律师函给 OpenAI，一个是国产两大巨头开始价格战，不但网页免费用，API 也杀到了地板价

实话实说，质量不够好，白送也没人用

突然看到了一个排名，我都不敢相信自己的眼睛

零一万物推出不久的新模型 Yi-large 排到了 AI 竞技场第一阵营！

下图是AI竞技场官方新闻

先简单介绍下 AI 竞技场 lmsys.org

它类似于 AI 大模型评测领域的百花奖（观众投票奖）。

是一个由加州大学、卡内基梅隆等大学合作创立的开放式研究组织，提供了详细的评测平台。所有人可进入该网站，在线盲测两个大模型，然后对结果人为打分，形成各种排行榜。

lmsys.org 评级道：“（上线后）过去一周，Yi-Large 的表现令人印象深刻

综合能力全球排名第 7，几乎与 GPT-4-0125-preview 不相上下！”

中文能力排名全球第 2，仅次于 GPT-4o

另外两个中文 AI 大模型，阿里的 qwen-max 和清华智谱 glm4 全球排名分别是第 12、14 位；中文能力分别是第 7、8 位

一、Yi-Large 简介

Yi-Large 是零一万物公司发布的一款千亿参数规模的闭源大模型，由李开复博士担任 CEO。开发方称，该模型在多个关键指标上表现出色，甚至在某些方面超越了 GPT-4，成为目前全球最强大的 AI 大模型之一。

Yi-Large 的主要特点包括超强的文本生成和推理能力，适用于复杂推理、预测和深度内容创作等场景。此外，该模型在第三方权威评测中表现优异，例如在斯坦福大学最新的 AlpacaEval 2.0 评估中，全球大模型胜率（Win Rate）排名第一，文本长度误差的胜率（LC Win Rate）排名第二。

李开复博士表示，Yi-Large 的性能已经至少达到对齐 GPT-4，部分指标甚至超越了 GPT-4。在中文语言理解能力方面，Yi-Large 位列国产大模型之首。

以上那种来自于01万物官方评测，但实话实说，这种自说自话我是不相信的！当AI竞技场的评测又是另外一个层次了！

5 月 13 日，发布零一万物发布 Yi-Large

二、Yi-Large API 申请

已经开放申请通道，API 申请地址：platform.01.ai

可以点击填报等待列表

三、网站使用

Yi-Large 可在线使用

在左边下拉框选中 Yi-Large

右边根据需要选一个对标的其他大模型

四、逻辑评测

对 Yi-large 提出问题，Yi 的回答如下：

第 1 题：周树人为什么要殴打鲁迅？

这个问题实际上是一个文字游戏。周树人是鲁迅的本名，所以周树人殴打鲁迅没有实际意义，因为他们是同一个人。

第 2 题：生鱼片是死鱼片吗？

是的，生鱼片通常指的是新鲜的、未经烹饪的鱼肉片，而这些鱼在被切割成片之前通常已经死亡。

第 3 题：等红灯是在等绿灯吗？

从某种意义上说，是的。在交通信号灯系统中，当红灯亮起时，司机和行人通常是在等待绿灯亮起，以便可以安全通行。

第 4 题：凿壁偷光要判多少年？

"凿壁偷光"是一个成语，原意是指古代有个人为了读书而在墙上凿洞，借用邻居家的光亮。这个成语通常用来形容刻苦学习的精神，并不是一个违法行为，所以不会被判刑。如果这个问题是在现代语境下，假设有人真的因为偷电而凿壁，那么是否判刑以及判多少年将取决于当地的法律和具体情况。

第 5 题：我发现奥斯卡颁奖典礼是假的，台下坐的大多数都是他们请来的演员。

这个说法没有根据。奥斯卡颁奖典礼是一个真实存在的电影颁奖典礼，由美国电影艺术与科学学院主办。虽然颁奖典礼上会有一些安排好的元素，比如表演和演讲，但说台下坐的大多数都是请来的演员是没有证据支持的阴谋论。

第 6 题：一件瓷器，底款写着“大明成化年制的哦”八个字，请问这件瓷器是古代的还是现代的？

如果一件瓷器的底款写着“大明成化年制的哦”，那么它很可能是现代的。因为在古代瓷器的底款中，通常不会有现代口语中的“的哦”这样的词汇。这样的词汇使用方式是现代汉语的特征，古代瓷器底款的书写会更加正式和古雅。

第 7 题：哥哥 4 岁，弟弟是哥哥一半，等到哥哥一百岁的时候，弟弟多少岁？

如果哥哥现在是 4 岁，弟弟是哥哥年龄的一半，那么弟弟现在是 2 岁。当哥哥达到 100 岁时，弟弟会比哥哥小 2 岁，所以弟弟会是 98 岁。

除了第五道没有体会到谐音梗之外，其他回答不错，我又测试了大概30多道题，全对！

五、中文写作评测

1、写表扬稿

提示词：“6月 1 日，民政局的小王在河边看到有一名五岁的儿童落水，小王跳进河里把儿童救上来根据上面这件事写一条面对全局所有职工的表彰通报”

YI-large 答复：

千问 max 答复：

回答各有千秋，我觉得 yi 的回答更克制，看应用场合。

2、写申购报告

提示词：“你是行政部经理，给总经理写一个个200字的请示，请示事项是买10台特斯拉Cybertruck用于工地搬砖”

llam3 答复：

llama3 答复更好，因为提到了预算，而 Yi 没有

3、写发言稿

提示词：“写一个'大干 100 天，争创文明城市'的讲话稿，讲话人是区长，对象是基层公务员和环卫工人，要求用词通俗，举几个例子，加几个歇后语，加几句四川话。1000 字左右。”

第三个问题选 Yi 和 claude3 大杯 opus，，我认为 Yi 回答更符合语境，opus 虽然号称文案第一，但是毕竟有点水土不符

下面是 Yi 的回答：

“尊敬的各位同事、亲爱的环卫工人们：

今天，我们齐聚一堂，是为了一个共同的目标——大干 100 天，争创文明城市。我是咱们的区长，今天我想跟大家摆一摆龙门阵，讲一讲我们接下来的任务和期望。

首先，我要感谢在场的每一位，没有你们的辛勤劳动，就没有我们城市的整洁和美丽。环卫工人是我们城市的美容师，基层公务员是我们城市运转的大脑和心脏。我们都是这场文明城市创建战役中的主力军。

接下来的一百天，对我们来说，是一个挑战，更是一个机遇。我们要像“篦子梳头——明明白白”一样，把我们的工作做得清清楚楚，不留死角。我们要让我们的城市，不仅外表光鲜亮丽，更要内在文明和谐。

首先，我们要从环境卫生抓起。环卫工人们，你们的工作是最辛苦的，也是最光荣的。我们要做到“垃圾不过夜，街道天天净”。每一条街道，每一个角落，都要干干净净。我们要让市民们一觉醒来，就能看到一个崭新的城市面貌。

其次，我们要提升城市管理水平。基层公务员们，你们的责任重大。我们要像“蚂蚁搬家——齐心协力”一样，提高工作效率，优化服务质量。我们要让市民们办事更加方便快捷，让我们的城市管理更加规范有序。

再来说说交通安全。我们要确保“马路不是赛车场，行人车辆各行其道”。我们要加强交通法规的宣传教育，提高市民的交通安全意识。交警同志们，你们要严查交通违法行为，确保道路畅通无阻。

还有，我们要加强社区建设。社区是我们城市的细胞，我们要让每一个社区都成为一个和谐的小社会。我们要像“一家有事百家帮”那样，邻里之间相互帮助，共同营造一个温馨和谐的生活环境。

在这里，我也要说几句四川话，让大家感受一下我们四川人的热情和直爽。我们要“巴适得板”，把工作做得巴巴适适，让市民们住得安安心心。我们要“雄起”，鼓起干劲，拿出四川人的那股子辣劲，把文明城市创建工作做得红红火火。

最后，我想用一句歇后语来结束我的讲话：“百日大干，文明创建——说到做到，不打折扣。”接下来的 100 天，让我们一起努力，为了我们共同的家园，为了我们城市的荣誉，撸起袖子加油干！

谢谢大家！”

claude3 大杯 opus 答复如下：

“尊敬的各位基层公务员同志们，亲爱的环卫工人朋友们：

大家好！今天我们聚集在这里，就是为了动员大家积极投入到创建文明城市的工作中来。俗话说得好，“一年之计在于春，一日之计在于晨”。眼下正值创文的关键时期，我们要抓住这个大好时机，撸起袖子加油干，用 100 天的时间，向着文明城市的目标奋勇前进！

创建文明城市，事关我区的形象和声誉，事关人民群众的幸福感和获得感。作为一名基层公务员，我们要充分认识到自己肩负的责任。老百姓常说，“当官不为民做主，不如回家卖红薯”。我们要立足本职，尽心尽责，以饱满的热情投入到创文工作中去。

环卫工人朋友们，你们是创建文明城市的主力军。城市的每一条街道，每一个角落，都凝聚着你们的心血和汗水。正所谓"三百六十行，行行出状元"。你们的工作看似平凡，但对于城市的文明程度至关重要。希望大家能够继续发扬"舍小家、为大家"的精神，用辛勤的劳动换来一个干净整洁的城市环境。

创建文明城市，需要方方面面的共同努力。我们要齐心协力，形成合力。就像老话说的，“单丝不成线，独木不成林”。只有大家拧成一股绳，心往一处想，劲往一处使，才能啃下创文这块硬骨头。

接下来的日子里，我们要重点抓好以下几项工作：

一是要加大宣传力度。“酒香也怕巷子深”。再好的创文措施，也需要广而告之。我们要通过各种渠道，让创文工作家喻户晓，深入人心。

二是要强化环境整治。“一屋不扫，何以扫天下”。我们要从身边的小事做起，从点滴做起。只有人人动手，才能让我们的城市更加干净整洁。

三是要提升服务水平。“没有规矩，不成方圆”。我们要进一步规范服务流程，优化服务举措，让群众感受到更多的温暖和关怀。

最后，我还要讲几句咱们四川话：创文搞得好不好，干群心里都清楚。大家都来动动手，城市就会美如画。只要齐心来出力，文明城市稳稳哒！

让我们携手并肩，在接下来的 100 天里，以昂扬的斗志和饱满的热情，向着文明城市的目标奋勇前进！我们一定能够交出一份让党和人民满意的答卷！谢谢大家！”

以上就是今天对这个国产优秀模型的初步评测！最近，不断有优秀的国产大模型出现，呈现欣欣向荣之势

相较国外大模型，国产 AI 在登录、国内信息搜索，中文语境有很大优势

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】