语音数据集汇总_musan数据集

作者：盐析白兔 | 2024-08-12 23:53:57

踩

musan数据集

1. 噪声集

The QUT-NOISE dataset，来自昆士兰科技大学（QUT）的噪声数据集，其中包括了Café，Car，Home，Reverb，Street，五种场景，每种场景下又分了两个小场景，一共十个场景，约12小时数据，其中reverbe_pool 感觉不常见，训练时可以考虑删除。
Environmental Background Noise dataset，来自UTDallas的噪声数据集，包括三个场景，Babble，Car，Machinery，数据约30秒一条，一共253条。
MUSAN corpus 来自David Snyder and Guoguo Chen and Daniel Povey，里面有三个文件夹，分别是music，speech 和 noise。noise分类下有两个文件夹，数据长短不一，包含了各种生活场景，扩展噪声集的丰富性，930条。
Nonspeech dataset 来自Ohio State University，数据长短不一，包括各种生活场景，扩展噪声集的丰富性，一共100条。
microsoft/DNS-Challenge
ETSI 降噪能力数据集

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/盐析白兔/article/detail/972151