首页 | 本学科首页   官方微博 | 高级检索  
     

利用门控循环编解码网络的语音增强方法
引用本文:常新旭,张杨,杨林,寇金桥,王昕,徐冬冬.利用门控循环编解码网络的语音增强方法[J].计算机工程与设计,2020,41(6):1762-1767.
作者姓名:常新旭  张杨  杨林  寇金桥  王昕  徐冬冬
作者单位:中国航天科工集团第二研究院北京计算机技术及应用研究所,北京100854;中国航天科工集团第二研究院北京计算机技术及应用研究所,北京100854;中国航天科工集团第二研究院北京计算机技术及应用研究所,北京100854;中国航天科工集团第二研究院北京计算机技术及应用研究所,北京100854;中国航天科工集团第二研究院北京计算机技术及应用研究所,北京100854;中国航天科工集团第二研究院北京计算机技术及应用研究所,北京100854
基金项目:装备发展部信息系统局“十三五”预研课题基金项目;装备预研领域基金项目
摘    要:为进一步提高基于深度神经网络的语音增强方法的语音增强性能,针对单独使用循环神经网络对上下文信息利用有限的问题,提出一种利用门控循环编解码网络的语音增强方法。使用编码器解码器架构实现,使用循环神经网络对干净语音特征与含噪语音特征之间的映射关系建模,深入挖掘当前待增强语音帧和上下文信息之间的联系。实验结果表明,所提方法相较于基于深度前馈神经网络的语音增强方法增强语音的质量与可懂度更高,语音增强的性能更好,相较于直接应用门控循环神经网络的语音增强方法,显著提升了增强语音的质量。

关 键 词:语音增强  深度神经网络  循环神经网络  门控循环单元  编解码器

Speech enhancement method based on gated recurrent encoder-decoder neural network
CHANG Xin-xu,ZHANG Yang,YANG Lin,KOU Jin-qiao,WANG Xin,XU Dong-dong.Speech enhancement method based on gated recurrent encoder-decoder neural network[J].Computer Engineering and Design,2020,41(6):1762-1767.
Authors:CHANG Xin-xu  ZHANG Yang  YANG Lin  KOU Jin-qiao  WANG Xin  XU Dong-dong
Affiliation:(Beijing Institute of Computer Technology and Application,The Second Institute of China Aerospace Science and Technology Corporation,Beijing 100854,China)
Abstract:To further improve the speech enhancement performance of the speech enhancement method based on deep neural network,a speech enhancement method based on deep gated recurrent encoder-decoder neural network was proposed focusing on the problem that using RNN alone has limited ability to model context information.The deep recurrent neural network was used to learn the mapping relationship between the clean speech and the noises features and correlations between the current frame to be enhanced and the context information.Experimental results show that the proposed method significantly outperforms the method using deep neural network in terms of both speech quality and intelligibility.
Keywords:speech enhancement  deep neural network  recurrent neural network  gated recurrent unit  encoder-decoder
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号