期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

免费

1篇

专业分类

无线电

1篇

出版年

2021年

1篇

排序方式： 共有1条查询结果，搜索用时 2 毫秒

基于Conv-TasNet的多特征融合音视频联合语音分离算法

下载免费PDF全文

徐亮王晶杨文镜罗逸雨《信号处理》2021,37(10):1799-1805

视听多模态建模已被验证在与语音分离的任务中性能表现优异,本文提出一种语音分离模型,对现有的时域音视频联合语音分离算法进行改进,增强音视频流之间的联系。针对现有音视频分离模型联合度不高的情况,作者提出一种在时域上将语音特征与额外输入的视觉特征进行多次融合,并加入纵向权值共享的端到端的语音分离模型。在GRID数据集上的实验结果表明,该网络与仅使用音频的时域语音卷积分离网络（Conv-TasNet）和音视频联合的Conv-TasNet相比,性能上分别获得了1.2 dB和0.4 dB的改善。相似文献