赞
踩
贯穿人类发展的历史长河,科学和技术始终是促进人类社会发展与变革的核心驱动力。
比如,指南针的发明,助力人类大航海时代的开启,让人类的财富获得了极大的增长。印刷术的发明,推动了人类文明的传承,大幅度提高了生产力。蒸汽机的发明,标志着人类进入了机械化时代。因特网的发明,推动人类进入了信息化时代。大数据技术和云计算平台的广泛落地,标志着产业迈入数智化时代。AlphaGo和AlphaFold的诞生,预示着机器人在某些垂直领域内比人类更专业、更聪明。GPT-4多模态大模型(简称GPT-4)的诞生,预示着人类距离AGI时代不再遥远……
国外著名的信息化咨询服务企业Gartner每年都会发布新兴技术成熟度曲线(Hype Cycle for Emerging Technologies),以帮助市场了解当前的新兴技术及其发展趋势。
引起人们兴趣的是,这些技术有可能成为驱动下一次人类社会生产力变革和产业革命的关键技术。
通过研究近10年(从2014年到2022年)Gartner发布的新兴技术成熟度曲线,我们发现:与AI相关的技术一直处于行业的“热点”地位,比如智能机器人、自动驾驶、深度强化学习、强人工智能、机器视觉、生成式人工智能等。这说明近10年来,AI技术一直都处于行业研究和产业落地的前沿地位,也是人类科技发展的重要方向。
我们的观点是,昨天的AlphaGo、今天的GPT-4,都是AI技术持续发展的必然结果。从整体而言,GPT-4不是终局,AGI之路还很漫长,未来大概率还会有新的范式和明星产品出现。
2015年12月,特斯拉创始人埃隆·马斯克和Y Combinator总裁山姆·阿尔特曼在蒙特利尔AI会议上宣布OpenAI成立。
因为谷歌在AI领域占据强大的领导地位,所以OpenAI从成立之初就仿佛一直活在巨人的阴影之下。
谷歌在自然语言处理领域的研究硕果累累,比如谷歌大脑团队在2017年发布了Transformer预训练模型,在2018年发布了基于转化器的双向编码表示(Bidirectional Encoder Representation from Transformers,BERT)模型,这两个研究成果将机器对自然语言的理解推到了新的高度,也是AI发展史上里程碑式的研究成果。
下面详细介绍从成立开始,OpenAI的重要发展历程。
(1)2018年以前一直默默无闻,“两耳不闻窗外事”,努力搞研发,做一些AI的基础建设工作,虽然发布了一些研究成果,但是由于效果一般,并没有激起多少浪花。
(2)2018年2月,由于理念不合,埃隆·马斯克宣布退出OpenAI,一时激起千层浪。随着埃隆·马斯克的退出,OpenAI的资金开始有些捉襟见肘。
(3)在谷歌的Transformer预训练模型发布后,OpenAI团队受到了极大启发,发现强大的算力+预训练+海量数据的方式可以让模型不断迭代和优化。2018年6月,OpenAI发布了生成式预训练转化器(Generative Pre-trained Transformer,GPT)小模型GPT-1。虽然该模型在自然语言生成(Natural Language Generation,NLG)领域有一定的效果,但是在自然语言理解方面效果一般,因此没有引起行业的广泛关注。
(4)2019年年初,为了解决资金问题,OpenAI改变了非营利组织的商业形态,将公司拆解为两个部分:技术部分仍是非营利组织,而商业部分变为营利组织,不过设置了投资回报率的上限,超过投资回报率上限的收益将转为非营利组织的收益。
(5)2019年2月,OpenAI发布了GPT-2。与GPT-1相比,该模型的参数更多,效果更好,开始引起学术界的关注。
(6)2019年7月,OpenAI获得了微软10亿美元的投资,并与微软深度绑定。在解决了资金问题之后,OpenAI开始专注于技术,发展进入了快车道。
(7)2020年,OpenAI推出了GPT-3。GPT-3引入了一些创新举措,比如指示学习,使得其推理能力大幅度提高,引起了行业更多的关注。
(8)2022年年底,OpenAI推出了爆款产品ChatGPT,快速火爆全球,让世人瞩目,全球开始争相模仿。
(9)2023年,OpenAI推出了GPT-4,其能力比ChatGPT有了显著提高,不论是在处理多模态任务上,还是在自然语言处理和生成能力上,都显著强于ChatGPT。一时间,GPT-4让全球膜拜,让对手胆寒。
可惜GPT-4尚未开源,具体的技术细节还不得而知。
我们觉得单模态大模型ChatGPT只是过渡产品,多模态大模型(类似于GPT-4)才代表AI未来的发展趋势。
这也解释了为什么OpenAI在发布ChatGPT短短几个月后就发布了具有划时代意义的,效果远超ChatGPT的多模态大模型GPT-4。
我们可以将OpenAI的发展历程分为5个阶段,分别是摸索期、低谷期、发展期、一鸣惊人期和高速发展期,如图1所示。
图1
(1)摸索期。2015—2017年是OpenAI发展的摸索期和初级阶段。在这个时期,OpenAI主要搭建平台,寻找技术方向和打磨队伍。
(2)低谷期。2018—2019年是OpenAI发展的低谷期。OpenAI遭遇了核心创始人的退出,也遭遇了资金方面的捉襟见肘。好在OpenAI有着强大的明星创始团队和科技大佬的支持,找到了微软这个“大靠山”。
(3)发展期。2020—2021年是OpenAI处在修炼内功的发展阶段,在解决了资金问题之后,找到了技术发展的方向,稳扎稳打,“撸起袖子加油干”。
(4)一鸣惊人期。2022—2023年,OpenAI的发展一鸣惊人,分别推出了两大明星产品ChatGPT和GPT-4,让世界瞩目,也改变了整个AI行业。
(5)高速发展期。从2024年开始将是OpenAI的高速发展期,GPT系列模型的能力会逐渐完善,新的版本也将陆续发布,商业应用和赋能的场景会越来越多。
OpenAI成功的因素
尽管OpenAI的发展并非一帆风顺,经历了创业前期的摸索、低谷和起伏,但是从整体而言OpenAI的发展十分迅猛。
自2015年成立到2022年年底,短短7年时间,OpenAI一跃成为AI领域的重要一极,甚至有成为领军人的“潜力”,这着实让人惊叹,也不禁让人感叹这家公司的伟大。
7年时间,弹指一挥间,很多公司倒闭了,很多公司裹足不前,为什么OpenAI能够快速崛起?OpenAI成功的因素到底有哪些?
下面尝试解答这些问题。
失败的原因有很多,成功的因素无外乎资金、人才和资源。通过对OpenAI的创始团队和公司发展历程的研究,在资金、人才和资源的基础上,我们总结出其成功的6个关键因素,如图2所示。
图2
(1)选择大于努力,伟大的事业吸引伟大的人才。OpenAI的创始团队选择AGI这个“伟大的事业”作为公司发展的方向,并励志打破巨头的垄断,成为AI势力中的重要一极。改变世界的梦想不一定适合所有创业者,毕竟不是每个人都适合做惊天地泣鬼神的大事,还有些人适合做立足于眼前的事情。对于大部分初创公司来说,第一个成功的因素可以弱化为公司选择的市场是否足够大,影响面是否足够广,影响的人群是否足够多。根据我们创业的经历,这里可以简单地给出一个市场容量的最低标准,比如对于100亿元的市场盘子,假设公司能占据的市场份额为10%,那就是10亿元的营收。这就是一家不错的公司。
(2)有众多复合型人才的明星创始团队。伟大的事业往往能吸引出类拔萃的人才。OpenAI的创始团队主要包含以下几类顶尖人才:顶级的“金主”、拔尖的投资人、全球有影响力的科技大佬和“技术大拿”。这意味着OpenAI在成立之初,就拥有了成功公司的3个因素:资金、人才和资源。当然,对于大部分初创公司来说,这个条件也可以弱化为初创公司需要管理人才、融资人才、技术人才和商务人才。“一个好汉三个帮”,一个公司要想成功,至少需要这几个方面的核心人才。
(3)充裕的启动资金。OpenAI在成立之初大概募资了10亿美元,这保证了OpenAI现金流的稳定性,即使公司在前几年发展方向不清晰,处于“不断摸索的状态”,也能保证公司轻松地“活下来”。对于初创公司来说,资金十分关键,这是公司能够战胜竞争对手的核心武器之一。
当公司发展处在低谷的时候,OpenAI的创始团队能快速融资,而且能找到大佬投“大钱”(微软投资了10亿美元)。这不仅能解决公司的生存问题,还可以依托大佬的资源,让公司快速成长。对于大部分初创公司来说,其实因素(3)和因素(4)也可以弱化为初创公司需要一个强大的CFO(Chief Financial Officer,首席财政官),这个CFO能够找到“金主”,为公司解决钱方面的后顾之忧。
(5)管理团队的战略应变和聚焦能力。在发现问题后,OpenAI的管理团队能快速地解决问题,而在发现方向不对后,能快速地调整方向。当发现方向可能是对的时,OpenAI的管理团队能做到战略聚焦,持之以恒地攻坚克难。对于大部分初创公司来说,因素(5)可以弱化为初创公司需要一个有能力和不断学习的掌舵人。
(6)站在巨人的肩膀上和获取核心资源。OpenAI的成功其实离不开竞争对手(比如,谷歌、Facebook等)的技术和人才,我们将其统称为“巨人”。OpenAI一直站在巨人的肩膀上。如前面所述,OpenAI的爆款产品ChatGPT借鉴了谷歌提出的许多技术思路。微软不仅给OpenAI带来了“枪和炮”,还给OpenAI带来了AGI应用的诸多场景,这可以帮助OpenAI的产品从实战中快速得到验证和迭代,并有助于加快商业化进程。对于大部分初创公司来说,因素(6)也具有现实价值,要努力找到自己创业的核心资源,这能够让创业事半功倍。
简而言之,一个公司要获得成功离不开资金、人才和资源。这3个因素是成功的充分条件。在有了这3个充分条件后,公司还需要确定正确的发展方向和愿景,并具有强大的战略应变、聚焦和执行能力。
OpenAI特殊的股权设计带来的启示
我曾经参加过一个科技论坛,有一位国内知名的区块链专家详细介绍了OpenAI特殊的股权设计,并赞赏该股权设计,提出了“灵魂拷问”:为什么在中国不能出现这种股权设计?为什么在这种股权设计中,即使没有绝对的掌控力,微软也愿意投巨资?
当然,专家并没有给出问题的答案,只是简单地提出自己的“灵魂拷问”。
OpenAI为什么要引入风险投资?
我们认为,核心原因还是OpenAI的“大数据、大算力、大参数量、大模型”模式太“烧钱”,大模型完整训练一次可能需要花费数百万美元,这头“吞金兽”很容易让OpenAI陷入“地主家也没有余粮”的困境。
为了既解决资金问题,又保持一定的独立性,2019年,OpenAI推出了全新的股权结构,在原来OpenAI非营利组织(OpenAI Inc)的基础上,成立了一家有限合伙公司(OpenAI LP Ltd),由该公司作为OpenAI Inc的融资平台,为OpenAI Inc提供资金支持,同时也允许该公司将利润分配给风险投资人和员工。
为了保留对公司的控制权,OpenAI Inc作为OpenAI LP Ltd的普通合伙人(General Partner,GP),主要负责OpenAI LP Ltd的管理和运营,而其他投资人、核心团队作为有限合伙人(Limited Partner,LP)。无论LP占股多少,都不直接参与公司的管理和运营,而只享受公司的投资回报。因为OpenAI Inc是非营利组织,所以无法上市,因此LP无法享受股票增值等收益,只能享受分红等权益。
为了让LP获得足够收益后合理退出,OpenAI做了特殊的设计,让LP可以从OpenAI LP Ltd的利润中获得回报。GP、LP的股权设计在现代股权设计中十分普遍,在此不做赘述。
下面重点介绍OpenAI最具特色的退出机制。股东对OpenAI LP Ltd的投资回报并不是无穷无尽的。为了兼顾OpenAI Inc的非营利性和独立性,OpenAI设计了“回报封顶”的特殊退出机制。
“回报封顶”采用分级策略,第一批合伙人(First Close Partner, FCP )最高可以获得100倍的利润回报,比如投资了10万美元,最高可以获得1000万美元的利润回报。后期进入的投资人的回报比例会有所降低,最高不会高于20倍。
所有LP在获得“回报封顶”规定的收益后,其股份将无偿转让给OpenAI Inc,至此将不再持有OpenAI LP Ltd的股份,也不再享有利润回报。
以微软为例,微软累计给OpenAI LP Ltd投资了约130亿美元,只享受公司的利润分享权,并不能直接参与公司的管理和运营。在获得“回报封顶”规定的收益后,微软的股份将无偿转让给OpenAI Inc,微软不再享有直接的利润回报。假设微软的收益倍数是10倍,微软投资了130亿美元,其总收益为1300亿美元,在微软从OpenAI LP Ltd累计获得1300亿美元后,微软的股份将无偿转让给OpenAI Inc。
此外,OpenAI LP Ltd也设置了详细的规则,规定了退出的顺序。退出机制可以简单地分为5个阶段,如图3所示。
图3
(1)第一个阶段:FCP享有优先退出权。直到FCP收回投资本金后,其他的LP才能选择退出。
(2)第二个阶段:公司拿出25%的利润分配给FCP和持股的员工,直到达到利润的上限。
(3)第三个阶段:微软享有75%的利润优先分配权,直到收回本金。
(4)第四个阶段:在微软收回本金后,其利润优先分配比例将下降至49%,其余的部分继续支付FCP和持股的员工的收益。
(5)第五个阶段:LP在获得“回报封顶”规定的收益后,所有的股份将无偿转让给OpenAI Inc。
OpenAI的股权设计确实做了一些创新,按照当前OpenAI LP Ltd获得的融资额,我们推算,其累计利润到达1500亿美元才能还完股东的投资本金和收益部分。
根据公开发布的财报数据,Meta 2022年的净利润为232亿美元,谷歌2022年的净利润为600亿美元,微软2022年的净利润为727亿美元,苹果2022年的净利润为998亿美元。
这四大巨头成立的时间分别为2004年、1998年、1975年和1976年,距今(2023年)的成立年限分别为19年、25年、48年和47年。
OpenAI在 2022年还处于亏损状态,大约亏损5亿美元,因此要获得1500亿美元的累计利润确实“路漫漫其修远兮”,任重而道远。
由此可以看出,微软花巨资投资OpenAI,可能看重的并不是短期回报或者现金回报,而是OpenAI给微软带来的商业价值和股票方面的回报。
综上所述,OpenAI特殊的股权设计确实可以给从事硬科技研发且需要巨大投入的科技公司带来一些启示,这样既能有效地解决资金问题,又能从长远上保持经营的独立性,值得行业借鉴。
OpenAI的FCP和微软等投资者因为相信AGI的潜力和价值而选择相信OpenAI,同时也相信AGI具有巨大的商业价值。从事硬科技研发的中小公司能否给投资者同样的愿景,并获得投资者的信任是一项重大挑战。
此外,在OpenAI后期的投资者中,最关键的角色是巨头微软。
我们认为最主要的原因是OpenAI的产品可以和微软的产品形成战略协同,从而大幅度提高微软的商业价值。
同时,微软拥有丰富的应用场景,也能快速推动OpenAI的产品商业化。两者其实是相辅相成、相互提高的关系。
因此,从事硬科技研发的中小公司能否找到类似的战略协同巨头,也是能否快速成功的关键因素。
OpenAI的横空出世重新点燃了各个行业对AI的热情,也让我们第一次感觉人类距离AGI越来越近。
作为2015年的创业公司,短短7年时间,OpenAI给行业带来了两款明星产品ChatGPT和GPT-4,给这个世界带来了如此大的震撼。
OpenAI到底能给创业者带来哪些启示?
这是本文想重点研究的课题。
以上详细讨论了OpenAI成功的6个因素。
我也是一名创业者,经过两年的摸索,我发现要做成事业,这6个因素至关重要。
当然,OpenAI还有很多其他闪光点,比如其独特的股权设计、战略自适应能力、协同伙伴的选择能力、战略聚焦和专注能力等,这些也是其快速成功的关键因素。
潮起潮落,花开花谢,AGI之路肯定不会一帆风顺,笑看风云,只有用平常心态看待一时的高峰和低谷,才能获得持续发展的能力和动力。
在AGI领域,未来肯定还会诞生其他的明星产品,只要在这条路上坚持不懈,就肯定会有收获。
对于广大的中小公司而言,道理也一样,虽然资金和资源相对少点,但是只要方向正确,保持正向现金流,付出持之以恒的努力肯定就会有收获。
我们衷心希望通过深入挖掘OpenAI成功的因素,能够对广大的科技爱好者、从业者或创业者有所帮助,也衷心希望他们能为多模态大模型的发展和应用做出贡献,从而实现其商业价值。
此外,与单模态大模型相比,我们认为多模态大模型(比如GPT-4)才是AI的未来,未来也会成为各行各业的基础AI设施,而单模态大模型(比如ChatGPT)只是过渡产品。
但是,我们发现当下很少有书籍或研究报告能够将多模态大模型的技术思路、技术亮点和实际应用案例详细介绍清楚。大部分书籍或者研究报告的介绍都是“蜻蜓点水”,点到为止,读者看完也不明白如何应用多模态大模型、如何和自己的场景结合产生商业价值。
基于这些痛点,《多模态大模型:技术原理与实战》一书做了详细介绍。
本书后面的章节会重点介绍OpenAI的两大明星产品ChatGPT和GPT-4的技术原理与技术亮点,并通过实际案例清晰地展示如何应用ChatGPT和GPT-4、如何产生商业价值。
本文截选自《多模态大模型:技术原理与实战》一书,想要了解更多多模态大模型的内容,欢迎阅读本书~~
↑限时五折优惠↑
限时五折优惠,快快抢购吧!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。