拥有本科生水平的Claude 3，究竟强在哪儿？

作者：花生_TL007 | 2024-03-25 07:17:33

踩

3月4日晚，OpenAI最大的竞争对手Anthropic发布了新一代AI大模型系列——Claude 3。

该系列包含三个模型，按能力由弱到强排列分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。

其中，能力最强的Opus在多项基准测试中得分都超过了GPT-4和Gemini 1.0 Ultra，在数学、编程、多语言理解、视觉等多个维度树立了新的行业基准。

在Claude 3发布后，各路测评纷至沓来，今天就让我们一睹为快，看看它的智慧究竟如何？

Anthropic官方表示，Claude 3系列包含三个模型，分别是：Opus、Sonnet和Haiku。

尽管并未给出Claude 3模型的具体参数，但也公布了此三个版本在各自性能和适配的任务上的差异，具体表现为：

• Claude 3 Opus——最智能的模型，可跨API和数据库规划和编码，在药物研发、市场分析等高度复杂的任务上具有最佳性能。拥有人类本科生水平的知识，可以熟练地处理开放式提示并处理复杂的任务。从官方发布的成绩单来看，在知识测试MMLU、推理测试GPQA、基础数学测试GSM8K等一系列基准测试中， Claude 3 Opus模型展现了卓越的性能，其每一项得分都全面超越了GPT-4以及Gemini 1.0 Ultra。

• Claude 3 Sonnet——平衡智能和速度，其高耐用性更适合企业，更实惠和

本文内容由网友自发贡献，转载请注明出处：https://www.wpsshop.cn/w/花生_TL007/article/detail/307886