当前位置:   article > 正文

基于音频指纹的听歌识曲系统

基于音频指纹的听歌识曲

听歌识曲,我想大家都不陌生。虽然不同的厂商识别率不同(可能是因为版权的原因),但是每个音乐APP都会有这么一个功能。我们以扣扣音乐为例,扣扣音乐听歌识曲功能比较丰富,不仅有基本的听歌识曲还有哼唱识别,识别到对应的歌曲后就直接返回对应的结果,如下图所示。

这里我们只关注听歌识曲部分,这一功能通常使用音频指纹(Audio Fingerprinting)实现。其主要流程大致可以分为两步:1)离线的音频指纹提取;2)在线的音频指纹匹配。音频指纹,顾名思义,和人类的指纹类似,从音频信号中提取唯一确定性的指纹,可用于识别音频样本或快速定位音频数据库中的类似项目。

音频指纹离线提取

音频指纹也是音频的一种特征,常用的提取方式也有三种:1)基于频带能量的音频指纹;2)基于landmark的音频指纹;3)基于神经网络的音频指纹。不管是哪种方式提取音频指纹都需要满足以下条件:时间局部性、平移不变性、鲁棒性和充分熵。

基于频带能量的音频指纹很好理解,就是把音频每一帧划分成一个一个子带,计算子带能量,然后进行差分处理,最后进行二值化来减少指纹内存占用大小࿰

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/112181
推荐阅读
相关标签
  

闽ICP备14008679号