当前位置:   article > 正文

01 Conv-TasNet论文分享_conv-tasnet: surpassing ideal time–frequency magni

conv-tasnet: surpassing ideal time–frequency magnitude masking for speech s

 题目:Conv-TasNet: Surpassing Ideal Time-Frequency Magnitude Masking for Speech Separation

                                                          文末附文章地址与开源代码地址

1. 动机:

单通道、与说话人无关的语音分体方法的准确性、延迟、计算成本不足,时频描述分离问题的几个问题,如信号相位和幅度的解耦, 语音分离的时频表示的次优性, 以及计算光谱图的长延迟。

2. 方法:

提出了一种完全卷积的时域音频分离网络 ,一个用于端到端时域语音分离的深度学习框架 Conv-TasNet ,使用线性编码器生成语音波形的表示,该表示经过优化以分离单个说话者。说话人分离是通过将一组加权函数(掩码)应用于编码器输出来实现的。然后使用线性解码器将修改后的编码器表示反转回波形。

3. 网络架构:

整体网络架构如下

详细网络架构如下

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/372378
推荐阅读
相关标签
  

闽ICP备14008679号