赞
踩
Noise92是一个噪声的语料库,包括一些语音增强中常用到的噪声,每个文件持续235秒,其中噪声的采样率均为19.98KHz,可以通过下采样得到想要采样频率的噪声,上面的文件都是.mat格式,可以利用MATLAB转成.wav格式。
下载地址:http://spib.linse.ufsc.br/noise.html
具体文件为
GRID是一个大型的多说话者视听句子语料库,用于支持语音感知中的联合计算行为研究。简而言之,语料库由高品质的音频和视频录音组成,由34位说话者(男性18位,女性16位)中的每个人说出1000个句子,该语料库以及转录本可免费用于研究。
下载地址:http://spandh.dcs.shef.ac.uk/gridcorpus/
具体文件为
这个语料库有干净的语音和固定信噪比(0dB,5dB,10dB,15dB)的混合语音,但是没有单独的噪声。
下载地址:https://ecs.utdallas.edu/loizou/speech/noizeus/
具体文件为
TIMIT共有6300个句子,来自美国8个主要方言区的630个说话者每人说10个句子。MIT网址现在已经打不开了,不过GitHub上有下载的地址
下载地址:https://github.com/philipperemy/timit
打开界面如下
上面给出了两个下载地址,其中第一个地址的界面为
下载的是BT种子,比较快。
第二个的界面为
这里需要用邮箱注册账号才能下载。
另外,GitHub上也有上传的已经下载的TIMIT,地址为:https://github.com/breky/notes/releases/tag/TIMIT
Common Voice数据集中的每一条都包含了一组独立 MP3 录音及相应的文本文件。数据集所记录的 9,283 小时的录音中,有许多条数据同时包含了年龄、性别、口音等人口统计元数据,能够训练语音识别引擎提升其准确性。
下载地址为:https://commonvoice.mozilla.org/zh-CN/datasets
该语料库输入邮箱即可下载。该网页下还有提供其他语料库
用于训练语音增强算法和TTS模型的噪声语音数据库
下载地址:https://datashare.ed.ac.uk/handle/10283/1942
这个语料库来自REVERB 2014 chanllenge。挑战假设在混响的会议室中使用1声道(1ch)、2声道(2ch)或8声道(8ch)麦克风阵列捕捉单个固定的远距离说话人所说的话。它具有真实记录和模拟数据两种功能,其中一部分模拟真实记录。
下载地址:https://reverb2014.dereverberation.com/download.html
该语料库中有1000小时的英语演讲
下载地址:http://www.openslr.org/12
该语料库是由 CHiME语音分离和识别发布
下载地址:https://chimechallenge.github.io/chime6/
不同环境中多通道声噪声记录的集合
下载地址:https://zenodo.org/record/1227121#.Xv2VsZP7RhE
中科大团队 115个采样频率16KHz的噪声数据
下载地址:http://staff.ustc.edu.cn/~jundu/The%20team/yongxu/demo/115noises.html
模拟和真实室内脉冲响应、各向同性和点源噪声的数据库。这些数据中的音频文件都是16kHz采样率和16位精度。
下载地址:https://www.openslr.org/28/
该语料库包含IEEE-Harvard语料库中的720个句子,由男性说话人发音,其中宽带录音的采样率为25KHz,窄带的采样率为8KHz,分布存放不同文件夹中。
下载地址:https://pan.baidu.com/s/1YyCulXvPtsOcAV5oD57G4Q
提取码:v0tv
该语料库包括IEEE-Harvard中句子的单通道的录制,由12 名以英式英语为母语的成人在无回声条件下录制,也是720个句子。
下载地址:http://datacat.liverpool.ac.uk/681/
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。