使用 GPT-4o 的视觉功能使用 Python 和 OpenAI API_gpt-4o python

作者：笔触狂放9 | 2024-08-09 17:38:18

踩

gpt-4o python

OpenAI的新旗舰型号GPT-4o已经上市整整两天了！它的视觉功能非常重要，我想对其进行测试，那么还有什么比使用 OpenAI 的 API 与模型交互更好的方法呢？

这样我们就可以一石二鸟——测试 API 和新模型的图像处理。我们将通过两个示例来强调该模型的视觉特征。在一个中，我们将处理静态图像，在另一个中处理视频。

对于我们的第一个用例，我们将为模型提供几何数学问题的图片，看看它是否可以解决该问题。

在我们的第二个用例中，我们将要求 GPT-4o 总结和描述视频的内容。

设置新的Python开发环境

与往常一样，我建议为您正在进行的任何新编码工作设置一个新的 Python 开发环境。请查看我下面的文章，了解如何执行此操作的详细分步演示。

设置环境后，您需要确保安装以下 Python 库。

pip install cv2
1

cv2是 Python 中的一个模块，属于 OpenCV（开源计算机视觉库）库的一部分。OpenCV 是一个开源计算机视觉和机器学习软件库。它包含大量优化算法，可用于各种任务，例如图像和视频分析。

您需要的另一件事是 OpenAI API 密钥，不幸的是，这是一个成本选项。根据我的经验，运行本文中的代码不会花费超过几美分。如果您还没有 API 密钥，请前往：-

https://platform.openai.com/api-keys

登录后，按照创建新密钥的说明进行操作，并记下其值，因为稍后您将需要它。

示例 1 — 解释图像

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/笔触狂放9/article/detail/954409