首页 | 本学科首页   官方微博 | 高级检索  
     

联合频谱映射与掩蔽估计的协作式语音增强方法
作者姓名:罗庆予  张天骐  方蓉  张慧芝
作者单位:1.重庆邮电大学通信与信息工程学院
基金项目:国家自然科学基金 ( 61671095, 61771085)、 重庆市自然科学基金 ( cstc2021jcyj-msxmX0836)、 重庆市教育委员会科研项目(KJ1600427, KJ1600429)资助
摘    要:为提高目前基于掩蔽与基于频谱映射的语音增强方法性能上界以及复杂环境下的泛化能力,提出了一种在联合复频谱 与复掩蔽学习框架下的协作式单通道语音增强方法。 该方法采用编码器-双分支解码器结构,在编解码部分设计了一种交互协 作学习单元(ICU)来监督交互语音信息流,并提供有效的潜在特征空间;中间层则是设计出一种多尺度融合 Transformer,以少 量参数在空间-通道维度上多尺度地提取细节信息后融合输出,同时对语音子频带与全频带信息建模。 在大、小数据集与 115 种噪声环境下进行实验,结果表明该方法仅以 0. 57 M 的参数量,取得比大部分先进且相关方法更优的主、客观指标,具有良好 的鲁棒性与有效性。

关 键 词:语音增强  复频谱映射  复掩蔽  多尺度融合 Transformer  轻量型网络
点击此处可从《电子测量与仪器学报》浏览原始摘要信息
点击此处可从《电子测量与仪器学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号