当前位置:   article > 正文

音乐指纹识别(一):音乐波形_声纹识别 前端怎么展示波形

声纹识别 前端怎么展示波形

现在大部分的手机音乐客户端中如,网易音乐,qq音乐中都有一个功能,可以通过听取一段音乐来识别这是哪一首歌曲。最早开始有这个功能是在Shazam中看见的,现在关于如何识别音乐也有较多的资料,这里通过一些简要的分析来说明听音识别歌曲是如何实现的。我们需要对计算机中的声音进行研究,获取一种能够代表这首歌曲的唯一标识,这就是我们通常说的音乐指纹。

在把音乐进行数字化后,以最原始的wav为例,计算机是使用一串数字来代表音乐的,通常来说,我们以一定的频率(44100Hz)对声音进行采样,存入文件时,以两个频道的格式进行存取。两个频道代表着左右声道。

为了更加直观,我们把wav的数据直接画出来。

这里用到了读取wav数据的库,wave 如果还没有安装 wave 可以使用命令进行安装:

pip install wave
  • 1

一下是绘制一个wav文件的代码:

import wave as we
import numpy as np
import matplotlib.pyplot as plt
from scipy.fftpack import fft,ifft
import matplotlib.mlab as mlab



def wavread(path):
    wavfile =  we.open(path,"rb")
    params = wavfile.getparams()
    framesra,frameswav= params[2],params[3]
    datawav = wavfile.readframes(frameswav)
    wavfile.close()
    datause = np.fromstring(datawav,dtype = np.short)
    datause.shape = -1,2
    datause = datause.T
    time = np.arange(0, frameswav) * (1.0/framesra)
    return datause,time

def main():
    path = 'night.wav'
    wavdata,wavtime = wavread(path)
    plt.title("Night.wav's Frames")
    plt.subplot(211)
    plt.plot(wavtime, wavdata[0],color = 'green')
    plt.subplot(212)
    plt.plot(wavtime, wavdata[1])


    plt.show()
    
main()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33

两个声道的声音绘制成图片:

在这里插入图片描述

这里我们使用的是wav文件的声音格式,但是我们大部分的音乐是使用mp3的,我们还需要就mp3的数据进行处理,下一节讲下mp3的处理方式。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/112196
推荐阅读
相关标签
  

闽ICP备14008679号