当前位置:   article > 正文

Figure 01:Figure与OpenAI合作的AI机器人惊艳全世界!能对话、能思考、会学习_figure: 个具 智能ai机器

figure: 个具 智能ai机器

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

硅谷有一家明星初创公司号称“机器人界的OpenAI”,吸引了科技界一众大佬的投资,它就是Figure。3月初Figure公司宣布已从亚马逊创始人贝索斯、英伟达、OpenAI和微软等巨头那里筹集了约6.75亿美元的资金,其公司估值达到了26亿美元。

美东时间3月14日,Figure公司发布了第一个由OpenAI大模型加持的机器人展示视频。仅仅是一个视频,就惊艳了全球科技界。而更让人惊叹的是,此时距离Figure宣布和OpenAI在AI人形机器人领域合作才刚刚过去13天。

Figure的原视频:

由于平台限制,无法直接上传视频,可以在我的微信公众号里观看视频详情。

关于Figure公司

Figure公司是一家位于美国加州桑尼维尔的创新型人工智能机器人公司,由布雷特·阿德科克(Brett Adcock)于2022年创立。这家公司的愿景是创造一种通用型人形机器人,旨在提高人类的生活质量,并解决劳动力短缺等现实问题。Figure公司的成立标志着人形机器人技术商业化的重要一步,其目标是开发能够在各种环境中执行多样化任务的机器人,从而在制造、物流、仓储和零售等多个行业发挥作用。

Figure公司在短时间内迅速崛起,吸引了包括亚马逊创始人贝索斯、英伟达、OpenAI和微软等科技巨头的投资,筹集了约6.75亿美元的资金,公司估值达到了26亿美元。

Figure公司的团队由来自IHMC、波士顿动力、特斯拉、Waymo和Google X等行业领先公司的专家组成,拥有超过100年的AI和人形机器人领域的经验。这些专家的专业背景和技术经验对于Figure公司在人形机器人领域的突破至关重要。公司的首席技术官Jerry Pratt在佛罗里达人类和机器认知研究所(IHMC)工作了20年,该所在机器人设计和控制方面是全球领先的机构。

Figure公司的商业模式不仅聚焦于技术创新,还着眼于实际应用和商业化。公司目前正在与零售商商谈商业化机会,旨在将Figure 01及其后续产品推广到实际的工作环境中,以解决劳动力市场的需求。Figure公司的长远目标是创造出能够在家庭助理、老年人护理甚至在其他星球建设新世界等领域发挥重要作用的机器人。

Figure 01的核心特性

Figure公司的核心产品是Figure 01,这是一款结合了人类形态的灵巧性和尖端AI技术的自主人形机器人。Figure 01的设计灵感来源于人类的身体结构,其手部设计用于开门和使用工具,四肢则使其能够高效移动、爬楼梯、搬运物品等。Figure 01的设计理念是利用现有的为人类形态设计的世界,通过机器人的灵活性和智能,扩展人类的能力和生产力。

值得一提的是,Figure公司与OpenAI的合作标志着人工智能领域的一个重要里程碑。这项合作的核心是开发下一代人形机器人的人工智能模型,旨在将OpenAI的强大AI能力与Figure在机器人硬件和软件方面的专业知识相结合。通过这一合作,Figure公司的人形机器人Figure 01得以装载OpenAI提供的视觉语言模型(VLM),使其具备了高级的视觉和语言智能。这种能力的提升不仅使得Figure 01能够与人类进行流畅的对话,理解自然语言指令,还能进行抓取和放置等动作,并解释其决策过程。此外,Figure 01的神经网络能够提供快速、低级别的灵巧机器人动作,这意味着机器人的动作更加接近人类的操作速度和流畅性。

视觉识别与理解能力: Figure 01机器人的端到端神经网络框架是其视觉识别与理解能力的核心。通过搭载的高清摄像头,Figure 01能够捕获周围环境的图像数据,并通过先进的图像识别技术,准确识别出摆放在面前的物品。例如,在官方发布的视频中,Figure 01能够识别桌面上的红苹果,并在被询问时,将苹果递给提问者。这种能力不仅基于静态物品的识别,还包括对环境中动态变化的理解和适应。

对话交流能力: Figure 01的对话交流能力得益于OpenAI的多模态模型,该模型能够处理语音文本并生成语言响应。Figure 01不仅能够理解自然语言指令,还能在对话中展现出逻辑思考和情境适应性。在交互视频中,当提问者提出开放式问题时,Figure 01能够结合上下文,给出合理的回答和执行相应的动作。例如,当被问及“我有什么能吃的吗?”时,Figure 01能够识别并递送桌上的食物。

逻辑思考与学习能力: Figure 01的逻辑思考与学习能力体现在其能够基于过去的图像数据和对话数据,生成语言响应和执行策略。这意味着,Figure 01不仅仅是简单地响应指令,而是能够理解任务的目的,并自主规划行动步骤。在处理垃圾收拾任务时,Figure 01能够一边解释其行为,一边流畅地执行任务,展现出其逻辑推理和学习能力。

自主性和适应性: Figure 01的行为是通过自主学习和适应环境而习得的,而非依赖于远程控制。这一点在机器人的动作执行中尤为明显。例如,Figure 01能够自主识别杯子和盘子应该放置的位置,并根据这些物品的特性(如杯子倒置、盘子卡在盘架上)进行分类放置。这种自主性和适应性使得Figure 01能够在多变的环境中灵活应对,更好地服务于人类。

Figure AI官网

最后,附上Figure AI的官网地址。

https://www.figure.ai/


精选推荐

  1. 完全免费白嫖GPT4的三个方法,都给你整理好了!

  2. AI领域的国产之光,ChatGPT的免费平替:Kimi Chat!

  3. Kimi Chat,不仅仅是聊天!深度剖析Kimi Chat 5大使用场景!

  4. 我用AI工具5分钟制作一个动画微电影!这个AI现在免费!

  5. 当全网都在疯转OpenAI的Sora时,我们普通人能做哪些准备?——关于Sora,你需要了解这些!

  6. 文心一言4.0 VS ChatGPT4.0哪家强?!每月60块的文心一言4.0值得开吗?

  7. ChatGPT和文心一言哪个更好用?一道题告诉你答案!

  8. 字节推出了“扣子”,国内版的Coze,但是我不推荐你用!

  9. 白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt

  10. 2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/377422
推荐阅读
相关标签