当前位置:   article > 正文

给数据集打标签python代码实现(1)_python大矩阵打标签

python大矩阵打标签

深度学习的第一步恐怕就是读数据了,数据集有很多种,有的数据集训练数据和标签是分开的并且有的数据集标签里有很多数据,需要提取标签里面有效的内容;有的数据集文件名即标签,下面以读取语音数据集为例,为大家介绍。

1 数据集文件名即为标签,如图所示

  1. import os
  2. import pandas as pd
  3. feeling_list=[]
  4. for item in mylist:
  5. if item[:1]=='a':
  6. feeling_list.append('angry')
  7. elif item[:1]=='f':
  8. feeling_list.append('fear')
  9. elif item[:1]=='h':
  10. feeling_list.append('happy')
  11. elif item[:1]=='n':
  12. feeling_list.append('neutral')
  13. elif item[:2]=='sa':
  14. feeling_list.append('sad')
  15. elif item[:2]=='su':
  16. feeling_list.append('surprise')
  17. labels = pd.DataFrame(feeling_list)
  18. ###读取语音特征MFCCS
  19. df = pd.DataFrame(columns=['feature'])#给生成的字典赋予名字feature为读取特征做准备
  20. bookmark=0
  21. for index,y in enumerate(mylist):
  22. X, sample_rate = librosa.load('G:/c++/liuyong/'+y, res_type='kaiser_fast',duration=1.9,sr=None)
  23. sample_rate = np.array(sample_rate)
  24. mfccs = np.mean(librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=13),axis=0)
  25. feature = mfccs
  26. #[float(i) for i in feature]
  27. #feature1=feature[:135]
  28. df.loc[bookmark] = [feature]
  29. bookmark=bookmark+1
  30. ####读取特征完毕
  31. newdf = pd.concat([df3,labels], axis=1)
  32. # axis = 1的时候,concat就是行对齐,然后将不同列名称的两张表合并
  33. ##至此标签和数据已经放到了一块,接下来可以对数据和标签形成的大矩阵一块做优化处理

item[:1]的作用是读取文件名字中的标签信息,不同的文件名item的数值不一样可以自己去试一试。

 

feeling_list.append将读取的文件以1列的形式保存

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/471711
推荐阅读
相关标签
  

闽ICP备14008679号