赞
踩
5月13日,GPT-4o发布,听说是低配钢铁侠的贾维斯?赶紧看一下~
GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频、图像和视频的任意组合作为输入,并生成文本、音频和图像的任意组合输出。(低配贾维斯_)它可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似(和人顺畅对话,强啊~)在一次谈话中。它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。(声称比GPT-4略强,成本更低)
根据传统基准测试,GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上设置了新的高水位线。
GPT-4o 通过过滤训练数据和通过训练后细化模型行为等技术,在跨模式设计中内置了安全性,还创建了新的安全系统,为语音输出提供防护。
GPT-4o 的功能将迭代推出,GPT-4o 的文本和图像功能开始陆续在 ChatGPT 中推出。现在 ChatGPT Plus 用户可以直接使用GPT-4o,感受这一全能AI的强大功能。
免费套餐中未来会提供 GPT-4o,但是有低于 Plus 用户 5 倍的消息限制。 升级GPT4可以更加深度体验哈~升级可参考 GPT4升级指南
开发人员现在还可以在 API 中访问 GPT-4o 作为文本和视觉模型。与 GPT-4 Turbo 相比,GPT-4o 速度提高 2 倍,价格降低一半,速率限制提高 5 倍。
计划在未来几周内在 API 中向一小群值得信赖的合作伙伴推出对 GPT-4o 新音频和视频功能的支持。
GPT-4o的功能很强大,比如两个GPT-4o互动并唱歌,和你视频对话,对话和人一样流畅,教你学外语学数学,和你开玩笑等等。这可能就是未来的MOSS啊~ 未来搭配到机器人上,未来可期啊~
这只是一个简单的生成手写诗句的例子。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。