01 Conv-TasNet论文分享_conv-tasnet: surpassing ideal time–frequency magni

作者：花生_TL007 | 2024-04-06 14:01:02

踩

conv-tasnet: surpassing ideal time–frequency magnitude masking for speech s

题目：Conv-TasNet: Surpassing Ideal Time-Frequency Magnitude Masking for Speech Separation

文末附文章地址与开源代码地址

1. 动机：

单通道、与说话人无关的语音分体方法的准确性、延迟、计算成本不足，时频描述分离问题的几个问题，如信号相位和幅度的解耦，语音分离的时频表示的次优性，以及计算光谱图的长延迟。

提出了一种完全卷积的时域音频分离网络 ,一个用于端到端时域语音分离的深度学习框架 Conv-TasNet ，使用线性编码器生成语音波形的表示，该表示经过优化以分离单个说话者。说话人分离是通过将一组加权函数（掩码）应用于编码器输出来实现的。然后使用线性解码器将修改后的编码器表示反转回波形。

整体网络架构如下

详细网络架构如下

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/花生_TL007/article/detail/372378?site