赞
踩
15日凌晨,OpenAI发布了万众期待的GPT-4!新模型支持多模态,具备强大的识图能力,并且推理能力和回答准确性显著提高。在各种专业和学术基准测试上的表现都媲美甚至超过人类。难怪OpenAI CEO Sam Altman称GPT-4“是我们迄今为止功能最强大的模型!”
关于GPT-4的能力,我在发布当天就做了测试,具体结果请阅读《OpenAI 发布GPT-4——全网抢先体验》。
对开发者来说,GPT-4最激动人心的是API接口同步发布。目前需要申请才能访问。我第一时间加入了waitlist,今天获得了访问权限,本文将跟大家分享GPT-4 API接口的使用以及大家关心的价格分析。
-
GPT-4 API的接口和参数跟早前开放的GPT-3.5接口一致,模型名称为:
模型名称
描述
最大token数
训练数据
gpt-4
比 GPT-3.5 模型更强大,能够执行更复杂的任务,并针对聊天场景进行了优化。 会不断迭代更新。
8,192
截至2021年6月
gpt-4-0314
gpt-4
的2023年3月14日快照版本。此模型在接下来3个月内不会更新,有效期截止2023年6月14日。
8,192
截至2019年10月
gpt-4-32k
与 gpt-4
功能相同,但上下文长度是gpt-4
的4 倍。会不断迭代更新。
32,768
截至2021年6月
gpt-4-32k-0314
gpt-4-32k
的2023年3月14日快照版本。此模型在接下来3个月内不会更新,有效期截止2023年6月14日。
32,768
截至2019年10月
由于还在beta阶段,GPT-4 API的调用有频次限制:
这个频次对功能测试和概念验证来说已经足够了。
如果使用ChatGPT Plus体验GPT-4,有4小时100条消息的限制。
GPT-4 API的定价策略与之前模型不同。在GPT-4之前,接口定价按照token数统一收费,不区分是prompt的token还是生成响应的token。而GPT-4将prompt token和生成响应token分开计价,价格如下:
这个价格相比 gpt-3.5-turbo
的 $0.002 / 1K tokens来说贵了至少15倍起。
由于GPT-4接口价格太贵,且prompt和生成响应分开收费,因此在大规模使用GPT-4 API之前,我们有必要对其价格进行细致的分析。
GPT+ 系列API最难评估的一点就是token数与单词(字数)的对应关系。因为我们能直观了解到的只有字数或单词数,而token数是tokenized后的标记数,我们无法直接准确的估计。好在接口会返回每次请求promot和生成响应的token数,我们可以通过统计手段大致获得一个token数和字数之间的对应关系。
我从短到长找了8篇文章输入GPT-4 API,为了结果稳定,模型我选择了稳定不更新的gpt-4–0314
,然后根据接口返回统计prompt token数,结果如下:
字数
token数
百分比
1
1,600
2,133
75.01%
2
2,000
2,667
74.99%
3
47,094
62,792
75.00%
4
90,000
120,000
75.00%
5
445,134
593,512
75.00%
6
783,134
1,044,183
75.00%
7
884,421
1,179,228
75.00%
8
1,084,170
1,445,560
75.00%
通过上面的测试结果,我们可以得到一个重要结论:
大约每750字(单词)消耗1000 token
我们首先横向比较一下几个模型的单价
$0.06
$0.03
$0.002
$0.02
$0.002
$0.0005
$0.0004
gpt-4(completion)
gpt-4(prompt)
gpt-3.5-turbo
davinci
curie
babbage
ada
gpt-4(completion)
0
1
29
2
29
119
149
gpt-4(prompt)
-0.5
0
14
0.5
14
59
74
从上表可以看到,gpt-4 prompt 比 gpt-3.5-turbo贵了14倍,gpt-4 completion 比 gpt-3.5-turbo贵了29倍!假设prompt和completion的字数为1:4(实际中completion往往比prompt要长),那么gpt-4接口的综合成本是gpt-3.5-turbo的27倍!
下面的表格更加直观地给出了各模型处理相应字数所需的花费:
从上表可见,gpt-3.5-turbo
$20美元能处理750万字,而相同金额在gpt-4
中只能处理30万字左右。
那么问题来了,是否值得花20多倍的成本去使用gpt-4?换句话说,gpt-4
相对gpt-3.5-turbo
的能力提升有没有20倍的效用?
这个问题的答案很大程度上依赖你的场景。如果是对正确性要求较高的场景(比如法律,教育等),那么GPT-4绝对是比GPT-3.5更好的选择。其他用例和场景我都建议进行深入测试,以确定增加的成本是否会带来比 ChatGPT API 对等的好处。
值得一提的是,gpt-4
模型的最大token数是gpt-3.5-turbo
的2倍,对于长文本生成的场景,如果gpt-3.5-turbo
最大4,096 token不够用,那么可以选择使用gpt-4
。同时GPT-4还提供了32K版本,支持32,768 token,不过价格也更贵。
总之,ChatGPT API 和 GPT-4 API 之间的选择取决于项目的具体需求和约束。当你站在尖端技术的十字路口时,请认真考虑真正重要的因素:
最终,你的决定将证明你的远见和拥抱人工智能变革带来的领先优势。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。