基于音频指纹的听歌识曲系统

作者：很楠不爱3 | 2024-02-19 02:51:09

踩

基于音频指纹的听歌识曲

听歌识曲，我想大家都不陌生。虽然不同的厂商识别率不同（可能是因为版权的原因），但是每个音乐APP都会有这么一个功能。我们以扣扣音乐为例，扣扣音乐听歌识曲功能比较丰富，不仅有基本的听歌识曲还有哼唱识别，识别到对应的歌曲后就直接返回对应的结果，如下图所示。

这里我们只关注听歌识曲部分，这一功能通常使用音频指纹（Audio Fingerprinting）实现。其主要流程大致可以分为两步：1）离线的音频指纹提取；2）在线的音频指纹匹配。音频指纹，顾名思义，和人类的指纹类似，从音频信号中提取唯一确定性的指纹，可用于识别音频样本或快速定位音频数据库中的类似项目。

音频指纹离线提取

音频指纹也是音频的一种特征，常用的提取方式也有三种：1）基于频带能量的音频指纹；2）基于landmark的音频指纹；3）基于神经网络的音频指纹。不管是哪种方式提取音频指纹都需要满足以下条件：时间局部性、平移不变性、鲁棒性和充分熵。

基于频带能量的音频指纹很好理解，就是把音频每一帧划分成一个一个子带，计算子带能量，然后进行差分处理，最后进行二值化来减少指纹内存占用大小࿰

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/很楠不爱3/article/detail/112181