当前位置:   article > 正文

智能已经具身!OpenAI 人形机器人首秀,可与人类进行完整对话

智能已经具身!OpenAI 人形机器人首秀,可与人类进行完整对话

3fabc80e82d0e6e5886334804831177e.gif

作者 | 王启隆

责编 | 唐小引

出品丨AI 科技大本营(ID:rgznai100)

目前,还有不少企业因成本和安全性问题仍对生成式 AI 犹豫不决。但时间不等人,随着 Google、特斯拉率先入局,国产的达闼、追觅乃至稚晖君创业的「智元机器人(AGIBot)」紧随进场,还有前段时间很火的斯坦福大学「炒菜机器人」,AI 已经逐渐掀开了机器人技术革命的帷幕。

当地时间 3 月 13 日,一家仅成立不足两年却已估值 26 亿美元的机器人创业公司 Figure 引爆了 AI 圈。这家公司的团队成员曾供职于波士顿动力、特斯拉、谷歌 DeepMind 及 Archer Aviation 等知名机构,他们在昨天首次公开展示了与新晋投资者及战略伙伴—— OpenAI 的合作成果,其表现令人赞叹不已。

10b1e2f0e207c88434c37d1d93a8924b.png

Figure 公司的联合创始人兼 CEO Brett Adcock 在 X 上发布了 Figure 01(读作“Figure One”)这款「全尺寸人形机器人」的演示视频,展现出其与周边人类及环境进行交互的能力。视频中,Figure One 成功按照人类指示行动,找到并递送一只苹果,实时描述自身动作,并与人进行交流(目前看来,其响应速度相较于正常人与人间对话略显滞后),还能够独立识别、策划并实施有用的行动(比如清理垃圾并将餐具放入沥水架)。

这段视频的整体观感堪称“科幻片”,甚至给人一种毛骨悚然的氛围感。开场时,人类向 Figure One 发问:“嘿,Figure One,你现在能看到什么呢?” 

Figure One 则迅速回应:“我看到桌子中间盘子里有一个红苹果,旁边有个挂着杯子和盘子的沥水架,还有你站在边上,手搭在桌子上。”

人类接着询问:“那能给我找点吃的吗?”

Figure One 自信回应:“没问题。”随后精确而稳当地抓取苹果递给人类,智能识别出眼前唯一可供食用的对象,无需人类具体指定。

视频接下来的画面则是 Figure 机器人将地面垃圾捡起,并有序地把盘子和杯子放入沥水架内的过程。 

795b24e2481182b0fee3765cc2e7b83e.png

众星捧月

GPT+机器人的这个组合可谓来得迅猛。

3 月 1 日,OpenAI 与总部位于加利福尼亚州的机器人初创企业 Figure 建立新的合作关系,计划将其大模型技术集成到人形机器人中,标志着 AI 开始迈向实体化应用的新阶段。

在这场合作中,Figure 成功获得了 6.75 亿美元的风险投资资金,使得其资本估值达到 26 亿美元。除了 OpenAI,Figure 的投资方涵盖了微软、英伟达、亚马逊工业创新基金等科技巨头,同时还有杰夫·贝索斯的一笔额外投资。其他主要投资者还包括 Parkway Venture Capital、Intel Capital、Align Ventures 以及 ARK Invest。

其中,Parkway Venture Capital 是最早看到 Figure 潜力的投资者之一,在 2023 年向 Figure 注资 7000 万美元。

此外,在和微软的合作中,还让 Figure 得到了微软云这一“神兵利器”。这家初创公司可以直接利用 Microsoft Azure 进行人工智能基础设施、培训和存储,甚至访问微软的人工智能基础设施和服务,以支持人形机器人的部署,从而协助完成现实世界的应用程序。

7fb1736e264ef3b662b7dd115034c0c7.png

目标驾驭十亿算力

e449c29a0df03ca792b864111ac287af.png

Adcock 在推文中透露:“Figure 机器人搭载的摄像头所捕捉的画面输入到由 OpenAI 训练的一个大型视觉语言模型(VLM)中。”

但目前尚不清楚这个模型是 GPT-4 的某种版本,还是对现有模型进行微调后的版本,抑或是全新的模型——比如很多人在 OpenAI 官推下“逼问”了一整个月的 GPT-4.5 Turbo。

令人印象深刻的是,Adcock 还指出:“视频展示的是端到端的神经网络系统。背后没有任何远程操控。此外,这段视频是以 1.0x 的真实速度连续拍摄的。

这段演示视频中的机器人能和人自然交流、听从指令、理解需求,并且动作流畅度远超以往许多同类公司和研究团队所展示的样品。而且,目前这还只是一个演示阶段的 Demo,离真正达到商业化标准并推向企业和个人市场,还需要大量的后续开发工作。

Adcock 在推文中还立志“训练一个世界级的人工智能模型,使其能够驾驭十亿级别的计算能力去操控人形机器人。”

0d96aafecb743cfe6c0b483e1c566e8b.png

在 Figure 公司的官网上,Adcock 也阐述了他的宏大蓝图——事实上,官网真的有一个叫作“宏大蓝图”(Master Plan)的页面:“Figure 旨在研发出能对人类生活产生积极影响、为后代创造更美好生活环境的通用型人形机器人。这类机器人有望消除那些既危险又不受欢迎的工作,从而让我们拥有更加幸福、更有价值的生活。”

他同时也不忘强调:“达成这一愿景需要数十年的努力,组建一支矢志不渝追求这一使命的顶尖团队,投入数十亿美元的资金,并通过工程技术创新来实现大规模的市场影响力。我们当前面临的风险极高,成功的可能性相对较低。”

在 OpenAI 的技术支持下,Figure 无疑将给包括特斯拉、亚马逊和众多初创企业在内竞争对手带来压力。与此同时,这个赛道甚至仍在不断涌入新玩家,例如本周刚刚成立的 Physical Intelligence 以及众多开发者熟悉的 Hugging Face 公司。

012762e32af40a04a84c92ff79a95ae5.gif

4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「全球机器学习技术大会」将在上海环球港凯悦酒店举行,特邀近 50 位技术领袖和行业应用专家,与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫描下方海报中的二维码,进一步了解详情。

6af45071a7259efe573d10351c967101.png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/298602
推荐阅读
相关标签
  

闽ICP备14008679号