当前位置:   article > 正文

语音信号处理常用语料库下载地址_noise-92库噪声下载

noise-92库噪声下载

Noise92噪声库

Noise92是一个噪声的语料库,包括一些语音增强中常用到的噪声,每个文件持续235秒,其中噪声的采样率均为19.98KHz,可以通过下采样得到想要采样频率的噪声,上面的文件都是.mat格式,可以利用MATLAB转成.wav格式。
下载地址:http://spib.linse.ufsc.br/noise.html
具体文件为
在这里插入图片描述

Grid Corpus

GRID是一个大型的多说话者视听句子语料库,用于支持语音感知中的联合计算行为研究。简而言之,语料库由高品质的音频和视频录音组成,由34位说话者(男性18位,女性16位)中的每个人说出1000个句子,该语料库以及转录本可免费用于研究。

下载地址:http://spandh.dcs.shef.ac.uk/gridcorpus/
具体文件为
在这里插入图片描述

Noisy Speech Corpus(NOIZEUS)

这个语料库有干净的语音和固定信噪比(0dB,5dB,10dB,15dB)的混合语音,但是没有单独的噪声。
下载地址:https://ecs.utdallas.edu/loizou/speech/noizeus/
具体文件为
在这里插入图片描述

TIMIT Corpus

TIMIT共有6300个句子,来自美国8个主要方言区的630个说话者每人说10个句子。MIT网址现在已经打不开了,不过GitHub上有下载的地址
下载地址:https://github.com/philipperemy/timit
打开界面如下
在这里插入图片描述
上面给出了两个下载地址,其中第一个地址的界面为
在这里插入图片描述
下载的是BT种子,比较快。
第二个的界面为
在这里插入图片描述
这里需要用邮箱注册账号才能下载。
另外,GitHub上也有上传的已经下载的TIMIT,地址为:https://github.com/breky/notes/releases/tag/TIMIT

Common Voice Corpus

Common Voice数据集中的每一条都包含了一组独立 MP3 录音及相应的文本文件。数据集所记录的 9,283 小时的录音中,有许多条数据同时包含了年龄、性别、口音等人口统计元数据,能够训练语音识别引擎提升其准确性。
下载地址为:https://commonvoice.mozilla.org/zh-CN/datasets
在这里插入图片描述
该语料库输入邮箱即可下载。该网页下还有提供其他语料库
在这里插入图片描述
在这里插入图片描述

爱丁堡Corpus

用于训练语音增强算法和TTS模型的噪声语音数据库
下载地址:https://datashare.ed.ac.uk/handle/10283/1942
在这里插入图片描述

可以选择使用迅雷下载,这样会快一点。另外,这里给出百度网盘的下载链接

下载链接:爱丁堡Corpus

提取码:61ot

REVERB Corpus

这个语料库来自REVERB 2014 chanllenge。挑战假设在混响的会议室中使用1声道(1ch)、2声道(2ch)或8声道(8ch)麦克风阵列捕捉单个固定的远距离说话人所说的话。它具有真实记录和模拟数据两种功能,其中一部分模拟真实记录。
下载地址:https://reverb2014.dereverberation.com/download.html
在这里插入图片描述

LibriSpeech Corpus

该语料库中有1000小时的英语演讲
下载地址:http://www.openslr.org/12
在这里插入图片描述

CHiME series Corpus

该语料库是由 CHiME语音分离和识别发布
下载地址:https://chimechallenge.github.io/chime6/
在这里插入图片描述

DEMAND Corpus

不同环境中多通道声噪声记录的集合
下载地址:https://zenodo.org/record/1227121#.Xv2VsZP7RhE
在这里插入图片描述

115 Noise Corpus

中科大团队 115个采样频率16KHz的噪声数据
下载地址:http://staff.ustc.edu.cn/~jundu/The%20team/yongxu/demo/115noises.html
在这里插入图片描述

Room Impulse Response and Noise Database

模拟和真实室内脉冲响应、各向同性和点源噪声的数据库。这些数据中的音频文件都是16kHz采样率和16位精度。
下载地址:https://www.openslr.org/28/
在这里插入图片描述

IEEE Corpus

该语料库包含IEEE-Harvard语料库中的720个句子,由男性说话人发音,其中宽带录音的采样率为25KHz,窄带的采样率为8KHz,分布存放不同文件夹中。
下载地址:https://pan.baidu.com/s/1YyCulXvPtsOcAV5oD57G4Q
提取码:v0tv

ARU speech corpus

该语料库包括IEEE-Harvard中句子的单通道的录制,由12 名以英式英语为母语的成人在无回声条件下录制,也是720个句子。
下载地址:http://datacat.liverpool.ac.uk/681/
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/633031
推荐阅读
相关标签
  

闽ICP备14008679号