语音信号处理常用语料库下载地址_noise-92库噪声下载

作者：笔触狂放9 | 2024-05-27 17:17:00

踩

noise-92库噪声下载

Noise92噪声库

Noise92是一个噪声的语料库，包括一些语音增强中常用到的噪声，每个文件持续235秒，其中噪声的采样率均为19.98KHz，可以通过下采样得到想要采样频率的噪声，上面的文件都是.mat格式，可以利用MATLAB转成.wav格式。
下载地址：http://spib.linse.ufsc.br/noise.html
具体文件为
在这里插入图片描述

Grid Corpus

GRID是一个大型的多说话者视听句子语料库，用于支持语音感知中的联合计算行为研究。简而言之，语料库由高品质的音频和视频录音组成，由34位说话者（男性18位，女性16位）中的每个人说出1000个句子，该语料库以及转录本可免费用于研究。

下载地址：http://spandh.dcs.shef.ac.uk/gridcorpus/
具体文件为
在这里插入图片描述

Noisy Speech Corpus（NOIZEUS）

这个语料库有干净的语音和固定信噪比（0dB，5dB，10dB，15dB）的混合语音，但是没有单独的噪声。
下载地址：https://ecs.utdallas.edu/loizou/speech/noizeus/
具体文件为
在这里插入图片描述

TIMIT Corpus

TIMIT共有6300个句子，来自美国8个主要方言区的630个说话者每人说10个句子。MIT网址现在已经打不开了，不过GitHub上有下载的地址
下载地址：https://github.com/philipperemy/timit
打开界面如下
在这里插入图片描述
上面给出了两个下载地址，其中第一个地址的界面为

下载的是BT种子，比较快。
第二个的界面为

这里需要用邮箱注册账号才能下载。
另外，GitHub上也有上传的已经下载的TIMIT，地址为：https://github.com/breky/notes/releases/tag/TIMIT

Common Voice Corpus

Common Voice数据集中的每一条都包含了一组独立 MP3 录音及相应的文本文件。数据集所记录的 9,283 小时的录音中，有许多条数据同时包含了年龄、性别、口音等人口统计元数据，能够训练语音识别引擎提升其准确性。
下载地址为：https://commonvoice.mozilla.org/zh-CN/datasets
在这里插入图片描述
该语料库输入邮箱即可下载。该网页下还有提供其他语料库

爱丁堡Corpus

用于训练语音增强算法和TTS模型的噪声语音数据库
下载地址：https://datashare.ed.ac.uk/handle/10283/1942
在这里插入图片描述

可以选择使用迅雷下载，这样会快一点。另外，这里给出百度网盘的下载链接

下载链接：爱丁堡Corpus

提取码：61ot

REVERB Corpus

这个语料库来自REVERB 2014 chanllenge。挑战假设在混响的会议室中使用1声道（1ch）、2声道（2ch）或8声道（8ch）麦克风阵列捕捉单个固定的远距离说话人所说的话。它具有真实记录和模拟数据两种功能，其中一部分模拟真实记录。
下载地址：https://reverb2014.dereverberation.com/download.html
在这里插入图片描述

LibriSpeech Corpus

该语料库中有1000小时的英语演讲
下载地址：http://www.openslr.org/12
在这里插入图片描述

CHiME series Corpus

该语料库是由 CHiME语音分离和识别发布
下载地址：https://chimechallenge.github.io/chime6/
在这里插入图片描述

DEMAND Corpus

不同环境中多通道声噪声记录的集合
下载地址：https://zenodo.org/record/1227121#.Xv2VsZP7RhE
在这里插入图片描述

115 Noise Corpus

中科大团队 115个采样频率16KHz的噪声数据
下载地址：http://staff.ustc.edu.cn/~jundu/The%20team/yongxu/demo/115noises.html
在这里插入图片描述

Room Impulse Response and Noise Database

模拟和真实室内脉冲响应、各向同性和点源噪声的数据库。这些数据中的音频文件都是16kHz采样率和16位精度。
下载地址：https://www.openslr.org/28/
在这里插入图片描述

IEEE Corpus

该语料库包含IEEE-Harvard语料库中的720个句子，由男性说话人发音，其中宽带录音的采样率为25KHz，窄带的采样率为8KHz，分布存放不同文件夹中。
下载地址：https://pan.baidu.com/s/1YyCulXvPtsOcAV5oD57G4Q
提取码：v0tv

ARU speech corpus

该语料库包括IEEE-Harvard中句子的单通道的录制，由12 名以英式英语为母语的成人在无回声条件下录制，也是720个句子。
下载地址：http://datacat.liverpool.ac.uk/681/
在这里插入图片描述

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/笔触狂放9/article/detail/633031