当前位置:   article > 正文

SER | 语音情绪识别 | TIM-NET_SER项目实现,以及训练自己的语音数据集,后期修改网络_timnet

timnet

大家好,今天复现的是目前语音情绪识别的SOTA论文,论文中文名称是 时间建模的重要性: 用于语音情感识别的新型时空情感建模方法 。论文中训练的数据集有英文德语等几个语音情绪识别中常见的语音情绪数据集,以对比精度权重等效果~各数据集的情绪数量不同,可参考以下代码

  1. CASIA_CLASS_LABELS = ("angry", "fear", "happy", "neutral", "sad", "surprise")#CASIA
  2. EMODB_CLASS_LABELS = ("angry", "boredom", "disgust", "fear", "happy", "neutral", "sad")#EMODB
  3. SAVEE_CLASS_LABELS = ("angry","disgust", "fear", "happy", "neutral", "sad", "surprise")#SAVEE
  4. RAVDE_CLASS_LABELS = ("angry", "calm", "disgust", "fear", "happy", "neutral","sad","surprise")#rav
  5. IEMOCAP_CLASS_LABELS = ("angry", "happy", "neutral", "sad")#iemocap
  6. EMOVO_CLASS_LABELS = ("angry", "disgust", "fear", "happy","neutral","sad","surprise")#emovo

论文地址 | [2211.08233] Temporal Modeling Matters: A Novel Temporal Emotional Modeling Approach for Speech Emotion Recognition (arxiv.org)

 项目地址 | Jiaxin-Ye/TIM-Net_SER: [ICASSP 2023] Official Tensorflow implementation of "Temporal Modeling Matters: A Novel Temporal Emotional Modeling Approach for Speech Emotion Recognition". (github.com)

一般语音训练对计算机的内存有要求,一般情况下建议内存超过12G(要不然很容易出现out of memery).

论文构架

环境设置

Ubuntu(docker 容器),Tensorflow-gpu2.7等

  1. # 克隆项目
  2. git clone https://github.com/Jiaxin-Ye/TIM-Net_SER
  3. #打开文件夹
  4. cd TIM-Net_SER
  5. #安装所需环境
  6. pip install -r requirement.txt

输入命令后如图所示

先下载测试所需要的作者已经提取的数据集 MFCC特征文件和测试模型的权重文件(提供百度和谷歌下载地址),没必要全部下载,例如我下载的就是 IEMOCAP数据集的相关文件。

MFCC特征文件(MFCC features files (*.npy)):

百度网盘下载地址: 百度网盘 请输入提取码 code: MFCC

谷歌云盘下载地址: https://drive.google.com/drive/folders/1nl7hej--Nds2m3MrMDHT63fNL-yRRe3d

 下载文件到这个路径下 TIM-Net_SER/Code/MFCC/

测试模型权重文件( testing model weight files (*.hdf5)):

Baidu links百度网盘 请输入提取码 code: HDF5

Google linkshttps://drive.google.com/drive/folders/1ZjgcT6R0A0C2twXatgpimFh1a3IL81pw

  下载文件到这个路径下 TIM-Net_SER/Code/Test_Models/

 (我的情况是远程服务器的docker容器中运行的,所以是先右键下载到本地笔记本,再利用MobaXterm上传到服务器,再输入docker复制命令,需要可参考扩展1.)

测试

如果前面俩个文件都下载的话就可以直接测试啦。测试命令

python main.py --mode test --data IEMOCAP  --test_path ./Test_Models/IEMOCAP_16 --split_fold 10 --random_seed 10

(如果出现out of memory请参考Q&A1.)

测试结果

 (中间省略)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/349598?site
推荐阅读
相关标签
  

闽ICP备14008679号