基于复数卷积循环神经网络的语音增强 |
| |
作者姓名: | 高键 李军锋 |
| |
作者单位: | 1. 中国科学院声学研究所语言声学与内容理解重点实验室;2. 中国科学院大学 |
| |
摘 要: | ![]() 基于神经网络的语音增强任务中相位估计不准确会导致增强语音质量差,针对这一问题,提出了一种基于复数卷积循环神经网络的语音增强算法,在复数域实现语音幅度和相位的同时增强,以提高增强语音的质量。使用基于复数卷积网络的编码器在复数域提取语音局部特征,再利用复数卷积循环网络对语音的长时信息进行建模,最后使用复数卷积上采样解码器计算语音复数时频掩蔽,实现语音幅度与相位增强。在公开数据集上的实验结果表明,使用所提方法得到的增强语音在语音质量和信噪比提升中均优于主流方法,验证了该网络模型在语音增强任务中的有效性。
|
关 键 词: | 语音增强 相位估计 复数神经网络 卷积循环神经网络 |
|
|