当前位置:   article > 正文

python增大音频音量_音频数据增强及python实现

python 调整音乐音调

博客作者:凌逆战

博客地址:https://www.cnblogs.com/LXP-Never/p/13404523.html

音频时域波形具有以下特征:音调,响度,质量。我们在进行数据增强时,最好只做一些小改动,使得增强数据和源数据存在较小差异即可,切记不能改变原有数据的结构,不然将产生“脏数据”,通过对音频数据进行数据增强,能有助于我们的模型避免过度拟合并变得更加通用。

我发现对声波的以下改变是有用的:Noise addition(增加噪音)、增加混响、Time shifting(时移)、Pitch shifting(改变音调)和Time stretching(时间拉伸)。

本章需要使用的python库:

matplotlib:绘制图像

librosa:音频数据处理

numpy:矩阵数据处理

使用先画出原始语音数据的语谱图和波形图

importlibrosaimportnumpy as npimportmatplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签

plt.rcParams['axes.unicode_minus'] = False #用来正常显示符号

fs = 16000wav_data, _= librosa.load("./p225_001.wav", sr=fs, mono=True)############ 画图

plt.subplot(2, 2, 1)

plt.title("语谱图&

本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号