当前位置:   article > 正文

拥有本科生水平的Claude 3,究竟强在哪儿?

拥有本科生水平的Claude 3,究竟强在哪儿?

30a34c8201bc48c89ae1d343e9a1dd38.png

 

3月4日晚,OpenAI最大的竞争对手Anthropic发布了新一代AI大模型系列——Claude 3。

该系列包含三个模型,按能力由弱到强排列分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。

其中,能力最强的Opus在多项基准测试中得分都超过了GPT-4和Gemini 1.0 Ultra,在数学、编程、多语言理解、视觉等多个维度树立了新的行业基准。

在Claude 3发布后,各路测评纷至沓来,今天就让我们一睹为快,看看它的智慧究竟如何?

Anthropic官方表示,Claude 3系列包含三个模型,分别是:Opus、Sonnet和Haiku。

 

尽管并未给出Claude 3模型的具体参数,但也公布了此三个版本在各自性能和适配的任务上的差异,具体表现为:

• Claude 3 Opus——最智能的模型,可跨API和数据库规划和编码,在药物研发、市场分析等高度复杂的任务上具有最佳性能。拥有人类本科生水平的知识,可以熟练地处理开放式提示并处理复杂的任务。从官方发布的成绩单来看,在知识测试MMLU、推理测试GPQA、基础数学测试GSM8K等一系列基准测试中, Claude 3 Opus模型展现了卓越的性能,其每一项得分都全面超越了GPT-4以及Gemini 1.0 Ultra。

• Claude 3 Sonnet——平衡智能和速度,其高耐用性更适合企业,更实惠和

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/307886
推荐阅读
相关标签
  

闽ICP备14008679号