GLM4V + ChatTTS给大模型提供视觉和语音

作者：小惠珠哦 | 2024-06-30 23:39:32

踩

glm4v

GLM4V + ChatTTS AI 助手示例

本文将指导你如何设置和使用 GLM4V + ChatTTS AI 助手。该设置需要一些配置和准备，尤其是如果你在 Apple Silicon 设备上运行代码。以下是详细步骤。

用GLM 4v + Chat TTS实现给大模型加上眼镜和声音

前提条件

代码地址：glm4v-assistant
你需要一个 GLM_API_KEY 来运行此代码。将其存储在项目根目录的 .env 文件中，或设置为环境变量。

由于 GLM4V 无法读取本地图片，需先将图片上传到服务器。本教程使用腾讯云 COS，配置你的腾讯云 COS 并上传所需图片。

步骤指南-MacOS

第一步：安装 Miniconda 和 PortAudio

首先，你需要安装 Miniconda 和 PortAudio。打开终端并运行以下命令：

brew install portaudio
brew install miniconda
1
2

第二步：设置虚拟环境

安装 Miniconda 后，创建一个虚拟环境，更新 pip 并安装所需的包：

# 创建虚拟环境
conda create -n glm4v python=3.8
conda activate glm4v
conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing

# 更新 pip
pip install --upgrade pip

# 安装所需包
pip install -r requirements.txt
1
2
3
4
5
6
7
8
9
10

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小惠珠哦/article/detail/774379