赞
踩
Meta 发布了名为SeamlessM4T的语音/文本翻译和转录新模型。以下是在 MacOS 上本地运行模型的方法。
在 MacOS 上运行模型需要一些工作;它需要几个复杂的步骤才能使事情正常工作。我花了几个小时让它工作,下载正确的包,构建 C++ 扩展,并运行所有内容。
该模型的代码位于此 GitHub Repo中。
https://github.com/facebookresearch/seamless_communication
但是,如果您在本地 Macbook 上遵循 README.md,它将无法工作,因为同样来自 Meta 的依赖项之一fairseq2目前不适用于 MacOS。所以需要建造它。
https://github.com/facebookresearch/fairseq2
要在 MacOS 上构建它需要付出最大的努力。
除此之外,我猜大多数 Mac 用户都使用 Homebrew 来安装所有其他依赖项;如果没有,您可以通过此链接获取。
我们需要 Homebrew 来实现一个名为 libsndfile 的依赖项来与 WAV 文件交互。这是链接。
https://brew.sh/
您还需要安装某个版本的 Python。我使用的是 Python 3.11,但示例显示您可以使用从 3.8 开始的旧版本。
http://www.mega-nerd.com/libsndfile/
首
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。