当前位置:   article > 正文

GPT-3「全面」开放,变现模式开启!

gpt-3是开放构架吗

卷友们好,我是rumor。

有一个好消息和一个坏消息。

好消息是,就在昨天,OpenAI发布博客说GPT-3的API不用再单独申请,要全面开放了!

c48ce733bfd47985756a2fe5fd80e33e.png

然而坏消息是,支持的国家地区中没有我们。。。

b1c140a8e6421fe4035b30f9a4fc6818.png

Oops???

What's more,虽然博客中说了没有开放的地区可以继续走waitlist申请,但就我身边申请到的朋友透露,还是用不了

4e8116c2956a1052cc81af3fb20a4d18.png

Anyway,原因就不去探究了,但OpenAI作为MaaS(Model-as-a-Service)的先行者,它的一举一动还是值得算法er去关注,如果它的大模型模式可以形成好的商业闭环,那中文大模型的商业化也指日可待。

下面就让我们来一起看看OpenAI是什么玩法。

产品化

做生意,首先要先清楚卖什么。

BERT虽然是个划时代的模型,但它真正应用起来却无法避免finetune步骤,只能通过两种方式盈利:

  1. 买方提需求,卖方出人力精调,赚这个需求的钱。但之后每个需求还是要付出一样的人力,边际成本不能很好递减

  2. 买方直接购买基模型,做一次性生意,无法持续获利

以上两种方式都不够理想,使得BERT不能成为一个长期产品。而GPT-3的NB之处,就在于它的zero-shot能力,在不精调、或者利用prompt的情况下就有一定效果,显著减少了第一种模式的边际成本,可以通过卖服务长期捞金。

考虑到需求不同,OpenAI开放了4种基模型:

2c5c83b29f2517bfd04cd4f839a5a946.png

每个模型都有自己不同的优点,其中Ada是最快最便宜的,可以完成简单的文本理解、句法解析任务,Davinci是最强的,可以应对复杂文本及因果分析。可以看到模型的性能排序与任务难度直接正相关。

除了每个模型能完成生成功能之外,OpenAI开推出了三种功能:

  • Instruction:和之前谷歌的一篇工作不谋而合,通过直接输入指令的形式,让模型更好地完成任务。目前这个功能只有curie和davinci可以做到

  • Codex:GPT-3的衍生模型,目前只有davinci可以做到,同时还有个更快的cushman-codex模型

  • Content filter:新推出的内容过滤功能,可以判断内容是否敏感、不安全

GPT-3是核心壁垒,但真正让买方动心的,是GPT-3可以产生的实际价值。从Guides上可以看到,基本的生成、分类、搜索、问答应用都已经被OpenAI考虑到了,并且开发了对应的API。比如分类支持用户提供有标注示例、搜索可以支持用户上传自定义文档。

经过一年的小范围试用,OpenAI已经能比较好地对这些应用进行抽象,向着落地更近一步。过去的一年大厂们都在各种卷大模型,每天用千亿万亿的参数在刷屏,而真正想落地到业务并不容易,每个业务都有自己的定制化需求。OpenAI这些开放的功能,是它们在「产品化」上的一种尝试,恰恰也为我们国产大模型提供了一个很好的范式,让做大模型的同学可以不再忍痛提供出自己训练的模型,而是「通用地提供定制服务」。

商业化

做生意第二步,想清楚怎么卖。

OpenAI采取了按量付费的方式,每个用户账户初始有18刀免费额度。模型收费情况如下:

1a760cbc34128fb34ff9023f4d8b98b0.png

精调同样也是这种付费方式,但价格是inference的5倍:

28039bef6ee3bc8941a80633f63515d3.png

这种方式对于小B比较友好,但大B就不划算了,需要私下联系OpenAI具体去谈。从这种计费方式,可以看到GPT3经过一年的试用,仍旧处于Beta阶段,没有开发出MaaS的包月包年、抢占资源、甚至更创新的模式。

除了按调用付费外,也可以看到OpenAI的「阶梯式」付费尝试。以往我们在使用软件时,可能会分为基础版、专家版等,每个更高级的版本会开放不同的功能,而OpenAI则是通过不同的模型来充当软件版本。

总结

从上面的介绍可以看到,OpenAI已经先一步开启了变现节奏,而这对我们有什么启发呢?个人觉得有以下两点:

  1. 作为大模型生产方,可以参考OpenAI,开始产品化与商业化的尝试。无论是独立的自负盈亏单位,还是大厂中台部门,都可以试着把自己的大模型按照上述功能形式进行整合,提供更省力的产品化服务

  2. 作为使用者,可以获得比自己现有模型更好的文本生成能力,用来产生更多的价值。文本生成的落地点其实也不少了,比如智能营销文案,可以为每个user生成个性化的推荐语,提升购买率,这个就有直接的变现收益,而人工是肯定写不完的。有嗅觉的算法er,也可以找到一个小蓝海的需求,自己加工一下GPT-3,为小B提供高价值的NLP能力

再回到GPT-3本身上,大语料训就完了,它究竟是不是核心壁垒呢?我认为是的,但一定是建立在「产品化」之后的产品上,这个产品,不仅是一个海量的参数合集,更是它在下游的适配能力和已有的一年task-specific数据积累。就像我们把算法落地一样,从来都不是一个模型能搞定的事情,而是多种技术的结合,以及对业务的理解。

利用目前的积累,产出服务和价值,并获取到更多的需求与数据。这个闭环run下去,才会形成真正的壁垒


欢迎对NLP感兴趣的朋友加入我们的「NLP卷王养成」群,一起学习讨论~

扫码添加微信备注「NLP」即可⬇️

1ea11a06ba04cb89b77d543159888f4e.png

5cdaba600e2dc5f33f20ede8afd3ecf1.png


大家好我是rumor

一个热爱技术,有一点点幽默的妹子

欢迎关注我

带你学习带你肝

一起在人工智能时代旋转跳跃眨巴眼

「我的壁垒就是我周五晚还在肝了吧」bbebb67547a2e2dc2044c01448bc8ba8.png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/610865
推荐阅读
相关标签
  

闽ICP备14008679号