当前位置:   article > 正文

测试一下 Anthropic 宣称超过 GPT-4 的 Claude 3 Opus_anthropic client.messages.create

anthropic client.messages.create

测试一下 Anthropic 宣称超过 GPT-4 的 Claude 3 Opus

0. 引言

今天测试一下 Anthropic 发布的 Claude 3 Opus。

3月4日,Anthropic 宣布推出 Claude 3 型号系列,该系列在广泛的认知任务中树立了新的行业基准。该系列包括三款最先进的型号,按功能升序排列:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。每个后续型号都提供越来越强大的性能,允许用户为其特定应用选择智能、速度和成本的最佳平衡。

Opus 和 Sonnet 现在可以在 claude.ai 和 Claude API 中使用,后者现已在 159 个国家/地区正式发布。

Claude 3 模型系列

在这里插入图片描述
以下是 Claude 3 型号与同行在多个性能基准 [1] 上的比较
在这里插入图片描述
强大的视觉能力

Claude 3 型号具有与其他领先型号相媲美的复杂视觉功能。它们可以处理各种视觉格式,包括照片、图表、图形和技术图表。我们特别高兴能为我们的企业客户提供这种新模式,其中一些客户拥有多达 50% 的知识库以各种格式编码,例如 PDF、流程图或演示幻灯片。

在这里插入图片描述
refer: https://www.anthropic.com/news/claude-3-family

1. 测试 Claude 3 Opus

题目是我之前写的 让 OpenAI GPT4 出 10 道题测试其他开源大语言模型

无图无真相,直接上截图,这样大家也可以自行判断一下效果。

import anthropic

client = anthropic.Anthropic(
    # defaults to os.environ.get("ANTHROPIC_API_KEY")
    # api_key="my_api_key",
)

def chat(content):
    return client.messages.create(
        model="claude-3-opus-20240229",
        max_tokens=1000,
        temperature=0,
        messages=[
            {"role": "user", "content": content}
        ]
    )

response = chat("<your question>")
print(response.content[0].text)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  1. 一个矩形的长是10厘米,宽是5厘米,求它的面积。
    在这里插入图片描述
  2. 中国的四大发明是什么?
    在这里插入图片描述
  3. 世界上最高的山是什么?
    在这里插入图片描述
  4. 牛顿第二运动定律是什么?
    在这里插入图片描述
  5. 水的化学式是什么?
    在这里插入图片描述
  6. DNA的全称是什么?
    在这里插入图片描述
  7. 《红楼梦》的作者是谁?
    在这里插入图片描述
  8. 太阳系中最大的行星是哪一个?
    在这里插入图片描述
  9. 乒乓球起源于哪个国家?
    在这里插入图片描述
  10. 世界上第一台电脑是什么?
    在这里插入图片描述

3. 试用 api key 限制

在这里插入图片描述

完结!

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号