搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
繁依Fanyi0
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
ps命令显示进程状态解析_ps服务ip状态
2
解析XML"--" is not permitted 错误_修改文件为xml时报错operation not permitted
3
虚拟机+Ngrok进行内网穿透_虚拟机内网穿透
4
Hive表数据优化_hive表的优化
5
不会大模型不要紧!只需5分钟!你也可以微调大模型!如何快速微调Llama3.1-8B_lora微调llama3.1
6
Ubuntu 22.04系统搭建环境编译AOSP P_ubantu aosp
7
Flink程序入门 ( java API )_flink java教程
8
06. 线性表——顺序表,按值查找,按位查找(查)_按值查找顺序表
9
BurpSuit联合Charles高效抓包_charles 跟burpsuite
10
2022第十三届蓝桥杯决赛C/C++大学A组-C题内存空间_蓝桥杯a组c语言题目
当前位置:
article
> 正文
CosyVoice升级版 - 阿里最新开源语音克隆、文本转语音项目 支持音色保存 本地一键整合包下载_funaudiollm下载
作者:繁依Fanyi0 | 2024-08-01 10:24:30
赞
踩
funaudiollm下载
近日,阿里通义实验室发布开源语音大模型项目FunAudioLLM,而且一次包含两个模型:
SenseVoice
和
CosyVoice
。
今天分享
的这个是v3ucn大佬优化过的升级版,新增自定义音色保存,优化长文本生成以及修复上个版本错误提示的bug。
一键包更新地址:
CosyVoice升级版 - 阿里最新开源语音克隆、文本转语音项目 支持音色保存 本地一键整合包下载
CosyVoice专注自然语音生成,支持多语言、音色和情感控制,支持中英日粤韩5种语言的生成,效果显著优于传统语音生成模型。
仅需要3~10s的原始音频,CosyVoice即可生成模拟音色,甚至包括韵律、情感等细节,包括跨语种语音生成。
而且CosyVoice支持以富文本或自然语言的形式,对生成语音的情感、韵律进行细粒度的控制,生音频在情感表现力上得到明显提升。
研究团队提供了基模型CosyVoice-300M、经过SFT微调后的模型CosyVoice-300M-SFT、以及支持细粒度控制的模型CosyVoice-300M-Instruct,可满足不同场景下的使用需求。CosyVoice-300M本身具备一定从文本内容中推断情感的能力,经过细粒度控制训练的模型CosyVoice-300M-Instruct在情感分类中的得分更高,具备更强的情感控制能力。
CosyVoice很好地建模了合成文本中的语义信息,达到了与人类发音人相当的水平。此外,通过对合成音频进行重打分,能够进一步降低识别的错误率,甚至在内容一致性和说话人相似度上超越人类。
0710优化版更新内容:
1、新增手动选择参考音频列表
将需要克隆的参考音频拷贝到软件根目录下的 “参考音频” 文件夹,并将文件名改名为音频说话内容,如下图
点击“刷新参考音频”即可。
2、自定义音色保存
克隆音色生成后,在下方输入音色名称,保存即可。如上图。
比如我们将克隆后的“大幂幂”的音色保存下来,这里输入 大幂幂
保存后,点这里的“刷新新增音色”
即可在新增音色里找到我们刚才克隆的“大幂幂”的音色
后期需要使用这个音色生成音频,就直接在这里选择“大幂幂”即可。
本文内容由网友自发贡献,转载请注明出处:
https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/913591
推荐阅读
article
语音
生成
工具:
CosyVoice
!为
角色
生成
个性化
语音
...
Datawhale学习实践:AI+
语音
生成
,出品方:魔搭社区每个
角色
有自己的性格、形象,那也一定需要自己个性化的声音。来...
赞
踩
article
CosyVoice
语音
合成TTS、声音克隆自定义
api
服务搭建;
requests
请求使用
_
cosy...
参考:https://blog.csdn.net/weixin
_
42357472/article/details/140...
赞
踩
article
CosyVoice
:开创多
语言
零样本文本到
语音
合成
的新纪元_
cosyvoice
大
模型
论文解读...
在人工智能的神奇世界里,文本到
语音
(Text-to-Speech, TTS)技术正逐步褪去机器的生硬外壳,向着自然流畅、...
赞
踩
article
“
CosyVoice
“:开启零
样本
语音
合成
新纪元_
cosy
voice
...
"
CosyVoice
"展示了文本到
语音
转换技术的未来方向,通过先进的自回归序列生成方法、条件流匹配模型和HiFiGAN声...
赞
踩
article
CosyVoice
TTS
实时语音合成语音克隆流式
api
接口
,
requests
请求使用案例_cosy...
参考:主要改动app.py 、
cosyvoice
.py两个文件,这里用的
CosyVoice
docker环境测试。_co...
赞
踩
article
CosyVoice
:开创多语言零样本文本到语音合成的新纪元_
cosyvoice
:
a
sc
a
l
a
bl...
在人工智能的神奇世界里,文本到语音(Text-to-Speech, TTS)技术正逐步褪去机器的生硬外壳,向着自然流畅、...
赞
踩
article
CosyVoice
- 阿里最新开源
语音
克隆
、
文本转
语音
项目
支持
情感
控制
及粤语 本地一键整合包
下载
...
CosyVoice
专注自然
语音
生成,
支持
多语言
、
音色和
情感
控制
,
支持
中英日粤韩5种语言的生成,效果显著优于传统
语音
生成模...
赞
踩
相关标签
语音识别
人工智能
tts
声音克隆
ai音频
语音
语音合成
深度学习
声音合成
ai声音
音视频