当前位置:   article > 正文

语音情绪识别_tess数据集

tess数据集

1.数据集

1.1  the Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS) dataset  RAVDESS数据集

1.2 the Toronto emotional speech set (TESS) dataset  TESS数据集

数据集样本个数:4240个

2.识别结果

01 = neutral,

02 = calm,

03 = happy,

04 = sad,

05 = angry,

06 = fearful,

07 = disgust,

08 = surprised

3.特征处理

    音频特征处理使用MFCC,获得40维的一维向量

    提取过程:连续语音--预加重--加窗分帧--FFT--MEL滤波器组--对数运算--DCT

4.神经网路模型

识别模型是基于cnn+mfcc的卷积神经网络

模型结构:

Model: "sequential_1"
_________________________________________________________________
Layer (type) Output Shape Param # 
==========

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/390572
推荐阅读
相关标签
  

闽ICP备14008679号