智能已经具身！OpenAI 人形机器人首秀，可与人类进行完整对话

作者：Cpp五条 | 2024-03-24 00:13:30

踩

作者 | 王启隆

责编 | 唐小引

出品丨AI 科技大本营（ID：rgznai100）

目前，还有不少企业因成本和安全性问题仍对生成式 AI 犹豫不决。但时间不等人，随着 Google、特斯拉率先入局，国产的达闼、追觅乃至稚晖君创业的「智元机器人（AGIBot）」紧随进场，还有前段时间很火的斯坦福大学「炒菜机器人」，AI 已经逐渐掀开了机器人技术革命的帷幕。

当地时间 3 月 13 日，一家仅成立不足两年却已估值 26 亿美元的机器人创业公司 Figure 引爆了 AI 圈。这家公司的团队成员曾供职于波士顿动力、特斯拉、谷歌 DeepMind 及 Archer Aviation 等知名机构，他们在昨天首次公开展示了与新晋投资者及战略伙伴—— OpenAI 的合作成果，其表现令人赞叹不已。

Figure 公司的联合创始人兼 CEO Brett Adcock 在 X 上发布了 Figure 01（读作“Figure One”）这款「全尺寸人形机器人」的演示视频，展现出其与周边人类及环境进行交互的能力。视频中，Figure One 成功按照人类指示行动，找到并递送一只苹果，实时描述自身动作，并与人进行交流（目前看来，其响应速度相较于正常人与人间对话略显滞后），还能够独立识别、策划并实施有用的行动（比如清理垃圾并将餐具放入沥水架）。

这段视频的整体观感堪称“科幻片”，甚至给人一种毛骨悚然的氛围感。开场时，人类向 Figure One 发问：“嘿，Figure One，你现在能看到什么呢？”

Figure One 则迅速回应：“我看到桌子中间盘子里有一个红苹果，旁边有个挂着杯子和盘子的沥水架，还有你站在边上，手搭在桌子上。”

人类接着询问：“那能给我找点吃的吗？”

Figure One 自信回应：“没问题。”随后精确而稳当地抓取苹果递给人类，智能识别出眼前唯一可供食用的对象，无需人类具体指定。

视频接下来的画面则是 Figure 机器人将地面垃圾捡起，并有序地把盘子和杯子放入沥水架内的过程。

众星捧月

GPT+机器人的这个组合可谓来得迅猛。

3 月 1 日，OpenAI 与总部位于加利福尼亚州的机器人初创企业 Figure 建立新的合作关系，计划将其大模型技术集成到人形机器人中，标志着 AI 开始迈向实体化应用的新阶段。

在这场合作中，Figure 成功获得了 6.75 亿美元的风险投资资金，使得其资本估值达到 26 亿美元。除了 OpenAI，Figure 的投资方涵盖了微软、英伟达、亚马逊工业创新基金等科技巨头，同时还有杰夫·贝索斯的一笔额外投资。其他主要投资者还包括 Parkway Venture Capital、Intel Capital、Align Ventures 以及 ARK Invest。

其中，Parkway Venture Capital 是最早看到 Figure 潜力的投资者之一，在 2023 年向 Figure 注资 7000 万美元。

此外，在和微软的合作中，还让 Figure 得到了微软云这一“神兵利器”。这家初创公司可以直接利用 Microsoft Azure 进行人工智能基础设施、培训和存储，甚至访问微软的人工智能基础设施和服务，以支持人形机器人的部署，从而协助完成现实世界的应用程序。

目标驾驭十亿算力

Adcock 在推文中透露：“Figure 机器人搭载的摄像头所捕捉的画面输入到由 OpenAI 训练的一个大型视觉语言模型（VLM）中。”

但目前尚不清楚这个模型是 GPT-4 的某种版本，还是对现有模型进行微调后的版本，抑或是全新的模型——比如很多人在 OpenAI 官推下“逼问”了一整个月的 GPT-4.5 Turbo。

令人印象深刻的是，Adcock 还指出：“视频展示的是端到端的神经网络系统。背后没有任何远程操控。此外，这段视频是以 1.0x 的真实速度连续拍摄的。”

这段演示视频中的机器人能和人自然交流、听从指令、理解需求，并且动作流畅度远超以往许多同类公司和研究团队所展示的样品。而且，目前这还只是一个演示阶段的 Demo，离真正达到商业化标准并推向企业和个人市场，还需要大量的后续开发工作。

Adcock 在推文中还立志“训练一个世界级的人工智能模型，使其能够驾驭十亿级别的计算能力去操控人形机器人。”

在 Figure 公司的官网上，Adcock 也阐述了他的宏大蓝图——事实上，官网真的有一个叫作“宏大蓝图”（Master Plan）的页面：“Figure 旨在研发出能对人类生活产生积极影响、为后代创造更美好生活环境的通用型人形机器人。这类机器人有望消除那些既危险又不受欢迎的工作，从而让我们拥有更加幸福、更有价值的生活。”

他同时也不忘强调：“达成这一愿景需要数十年的努力，组建一支矢志不渝追求这一使命的顶尖团队，投入数十亿美元的资金，并通过工程技术创新来实现大规模的市场影响力。我们当前面临的风险极高，成功的可能性相对较低。”

在 OpenAI 的技术支持下，Figure 无疑将给包括特斯拉、亚马逊和众多初创企业在内竞争对手带来压力。与此同时，这个赛道甚至仍在不断涌入新玩家，例如本周刚刚成立的 Physical Intelligence 以及众多开发者熟悉的 Hugging Face 公司。

4 月 25 ~ 26 日，由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「全球机器学习技术大会」将在上海环球港凯悦酒店举行，特邀近 50 位技术领袖和行业应用专家，与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众，共同探讨人工智能领域的前沿发展和行业最佳实践。欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫描下方海报中的二维码，进一步了解详情。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Cpp五条/article/detail/298602