王炸！OpenAI全新模型GPT-4o推出！免费使用，实时语音视频交互来了！

作者：Monodyee | 2024-05-23 02:00:00

踩

hello gpt-4o

北京时间5月14日凌晨，OpenAI 春季新品发布会举行，新一代旗舰生成模型 GPT-4o来了。GPT-4o 的推出代表着技术进步的一大步，集成了文本、语音和图像三种模态，使人机交互更加自然和高效。

这样的话，目前可以使用的版本包括了ChatGPT 4o，GPT-4，GPT-3.5这三种可以选择。

首先通过一张图片了解发布会的全部内容。

原文地址：https://openai.com/index/hello-gpt-4o

OpenAI推出了GPT-4o，这是一款能够实时处理和生成文本、音频和图像的新模型。GPT-4o具备快速响应能力，非英语语言处理能力显著提升，并且在音频和视觉理解方面表现出色。该模型将所有模态集成到一个神经网络中，减少了延迟并提高了效率。GPT-4o还加强了安全措施，并通过API供开发者使用。最初发布版本包括文本和图像功能，音频和视频功能将在未来推出。

以下是 GPT-4o 的主要特性：

多模态交互：

文本、音频和图像理解与生成：GPT-4o 能够同时处理和生成文本、音频和图像，极大地提高了模型的实用性。
实时响应：平均响应时间缩短至 320 毫秒，显著快于之前的模型，接近人类的响应速度。

增强的智能与情感理解：

自然互动：GPT-4o 不仅能够理解复杂的指令，还能表现出各种情感，提供更加人性化的交互体验。
实时语音对话：用户可以随时打断 AI 的话，不用等它说完，模型的反应速度超快。

视觉与代码能力：

视觉能力：GPT-4o 能够实时处理视觉信息，甚至可以教人解决数学题。
代码解释与生成：用户可以通过语音与 GPT-4o 互动，让它解释代码并生成相应的结果，例如温度曲线图。

提升的性能与多语言支持：

非英语文本处理：在多语言处理方面表现显著提升，尤其是在音频和视觉理解上表现卓越。
降低成本：API 速度更快，成本降低 50%。

最令人震撼的是，现在普通用户也可以使用GPT-4o账号了。这也是OpenAI免费战略的一部分，只是速度会受到限制，而Plus用户的限制会小很多。

GPT-4o账号请关注大数据流动，回复：“GPT-4o”

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Monodyee/article/detail/610860