赞
踩
OpenAI的新旗舰型号GPT-4o已经上市整整两天了!它的视觉功能非常重要,我想对其进行测试,那么还有什么比使用 OpenAI 的 API 与模型交互更好的方法呢?
这样我们就可以一石二鸟——测试 API 和新模型的图像处理。我们将通过两个示例来强调该模型的视觉特征。在一个中,我们将处理静态图像,在另一个中处理视频。
对于我们的第一个用例,我们将为模型提供几何数学问题的图片,看看它是否可以解决该问题。
在我们的第二个用例中,我们将要求 GPT-4o 总结和描述视频的内容。
与往常一样,我建议为您正在进行的任何新编码工作设置一个新的 Python 开发环境。请查看我下面的文章,了解如何执行此操作的详细分步演示。
设置环境后,您需要确保安装以下 Python 库。
pip install cv2
cv2是 Python 中的一个模块,属于 OpenCV(开源计算机视觉库)库的一部分。OpenCV 是一个开源计算机视觉和机器学习软件库。它包含大量优化算法,可用于各种任务,例如图像和视频分析。
您需要的另一件事是 OpenAI API 密钥,不幸的是,这是一个成本选项。根据我的经验,运行本文中的代码不会花费超过几美分。如果您还没有 API 密钥,请前往:-
https://platform.openai.com/api-keys
登录后,按照创建新密钥的说明进行操作,并记下其值,因为稍后您将需要它。
示例 1 — 解释图像
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。