首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
语音增强技术就是要抑制噪声,从带噪语音信号中尽可能的提取纯净的语音信号,提升其可懂度和清晰度。神经网络能够模拟人脑的工作原理,具有自学习能力和强大的非线性映射能力,故采取BP神经网络以及深度学习两种主流模型来展开研究,在此基础上研究了基于深度学习的反馈网络语音增强方法。通过对神经网络重复预训练和自学习,使之可以实现从带噪语音幅度谱到噪声幅度谱的非线性映射,同时训练了多个阈值和权重下的深度网络。通过真并对比其性能取得了很好的去噪效果。  相似文献   

2.
针对传统深度神经网络语音增强算法未区分在不同信噪比环境中去噪的侧重点,同时考虑到预测相位信息对于语音增强的重要性,提出了时频掩码优化的两阶段语音增强算法.第一阶段将带噪语音的幅度谱特征输入深度神经网络进行训练,预测得到干净语音幅度谱和噪声幅度谱;第二阶段通过信噪比信息估计增益系数,以控制残留噪声和语音失真之间的平衡;同...  相似文献   

3.
基于分数阶谱相减的语音增强法   总被引:2,自引:0,他引:2  
该文提出了基于分数阶谱相减的语音增强法(FSS)。该方法通过对带噪语音信号作分数阶傅里叶变换(FRFT),将得到的分数阶语噪混合谱与估计的分数阶噪声谱相减,最后利用分数阶Fourier反变换获得去噪后的语音信号。理论分析表明,所提方法存在一个最佳分数阶阶数,使得语噪混合信号能在分数阶变换域得到最好的分离,从而有效地提高了增强语音的性能。计算机仿真表明,对于混有加性白噪声的男/女声发音信号,所提方法在信噪比提高量和Itakura距离减少量两个方面都优于传统的谱相减法(SS),并且增强语音中的音乐噪声得到了明显抑制。  相似文献   

4.
刘斌  陶建华 《信号处理》2017,33(3):268-272
本文提出了一种联合长短时记忆递归神经网络和非负矩阵分解方法对单通道语音进行混响消除;对语音信号的对数功率谱建模抑制混响干扰。首先通过长短时记忆递归神经网络估计对数功率谱,这种模型结构能捕获整个音频序列的信息重构纯净语音的对数功率谱,然后通过非负矩阵分解方法对重构的对数功率谱进行后处理抑制过平滑问题;实验结果表明所提方法可以有效抑制语音信号中的混响干扰,本文方法的各种性能指标优于基线方法。   相似文献   

5.
基于多频带谱减法的抗噪声语音识别研究   总被引:1,自引:0,他引:1  
为了减少在噪声环境下测试条件与训练条件不匹配导致的语音识别性能下降,提出了一种结合多频带谱减法的抗噪声语音识别系统。首先提取带噪语音的前几帧作为估计的噪声信号,将带噪语音、估计的噪声信号按频率划分M个互不相交的频带,然后根据每个频带内带噪语音与估计的噪声信号的性噪比,来确定该频带噪声的谱减参数。语音增强作为前端处理,与语音识别器级连构成抗噪声语音识别系统。通过实验仿真表明,基于多频带谱减法的抗噪声语音识别系统在不同信噪比不同类型的噪声下,识别性能明显优于基本谱减法。  相似文献   

6.
语音增强是语音处理中常用的手段,在传播语音信号的同时噪声信号也随之添加进来,为了得到纯净的语音信号,我们对带噪信号进行语音增强,我们一般使用谱减法进行语音增强,但面对变化较大的噪声效果不理想。文章提出了一种改进的谱减语音增强方法,通过实验仿真表明,该方法有效地解决了噪声变化大情况下的语音增强。  相似文献   

7.
语音增强是语音处理中常用的手段,在传播语音信号的同时噪声信号也随之添加进来,为了得到纯净的语音信号,我们对带噪信号进行语音增强,我们一般使用谱减法进行语音增强,但面对变化较大的噪声效果不理想。文章提出了一种改进的谱减语音增强方法,通过实验仿真表明,该方法有效地解决了噪声变化大情况下的语音增强。  相似文献   

8.
基于信号相位差和后置滤波的语音增强方法   总被引:1,自引:0,他引:1  
马晓红  李瑞  殷福亮 《电子学报》2009,37(9):1977-1981
 在复杂的声学环境中,通常噪声场特性和混响强度是未知的,这样就对麦克风阵列语音增强算法的性能提出了较高的要求.本文提出一种基于带噪语音信号相位差和后置滤波的语音增强方法.首先,将麦克风阵列接收信号分帧,利用相邻两个麦克风之间每帧带噪语音信号的相位差,构成该帧改变频率点幅度谱值的比例系数,对该帧带噪语音信号进行掩蔽增强处理,得到预处理信号;然后利用固定波束形成、独立分量分析算法和后置滤波技术对预处理信号进一步处理,从而有效地抑制了噪声.计算机仿真实验结果表明,在存在一定混响的多种噪声场中,该方法均具有较好的噪声抑制能力.  相似文献   

9.
《信息技术》2018,(3):113-116
针对低信噪比下语音性能不佳及经验模态分解(EMD)在语音增强中的有效应用,文中提出了一种基于奇异谱分析(SSA)与EMD的语音增强算法。将含噪语音信号做EMD分解,对噪声IMF分量及信号IMF分别采用小波变换和SSA去噪处理。在输入信噪比为-10d B到10d B的高斯白噪声环境下进行仿真实验。结果表明文中提出的是一种有效的语音增强算法。  相似文献   

10.
结合经典语音谱相减算法的基本理论,针对在恢复时域信号过程中利用带噪语音相位来代替纯净语音相位而使消噪效果变差的缺点,基于带噪语音功率谱、噪声谱和纯净语音功率谱三者相位几何关系,提出一种直接使用纯净语音相位来恢复信号的改进算法.经过仿真实验,通过对时域波形图以及信噪比的比较,结果表明提出的算法比经典的谱相减算法均有一定的提升.  相似文献   

11.
袁文浩  梁春燕  夏斌  孙文珠 《电子学报》2018,46(10):2359-2366
在时频域的语音增强中,幅度估计和相位估计都是影响语音增强性能的重要因素.为了在基于深度学习的语音增强方法中融合对相位的估计,本文将含噪语音短时傅里叶变换(STFT)的实部和虚部特征作为两个通道输入深度卷积神经网络,通过建立一个同步估计纯净语音STFT的实部和虚部特征的多任务学习模型,实现了对幅度和相位的同步估计.实验结果表明,相比仅考虑幅度估计的方法,本文方法具有更好的噪声抑制能力,在低信噪比条件下,显著提高了语音增强性能.  相似文献   

12.
为改善旋翼飞机空地语音通信质量,针对旋翼飞机螺旋桨造成的幅度调制(Amplitude Modulation,AM)信号复杂多频干扰以及恶劣机舱背景噪声,提出了一种通信语音时频掩膜智能增强方法,从而实现对机舱噪声与复杂干扰的有效抑制。该方法首先对原始时域语音信号进行分帧与加窗,通过短时傅里叶变换获取幅度谱与相位谱;然后将原始幅度谱作为网络输入,采用深度神经网络分析其语音信号的特征,采用长短期记忆网络挖掘语音信号的时序上下文信息,实现对语音时频掩膜的准确估计,并将其用于增强原始幅度谱以得到网络输出;最后结合原始相位谱,通过逆短时傅里叶变换获得增强后的时域语音信号。仿真与实际测试表明,该方法可有效抑制旋翼飞机环境下的干扰噪声,提高通信语音信号质量。  相似文献   

13.
现有的深度神经网络语音增强方法忽视了相位谱学习的重要性,从而造成增强语音质量不理想。针对这一问题,文中提出了一种基于卷积循环网络与非局部模块的语音增强方法。通过设计一种编解码网络,将语音信号的时域表示作为编码端的输入进行深层特征提取,从而充分利用语音信号的幅值信息以及相位信息。在编码端和解码端的卷积层中加入非局部模块,在提取语音序列关键特征的同时,抑制无用特征,并引入门控循环单元网络捕捉语音序列间的时序相关性信息。在ST-CMDS中文语音数据集上实验结果表明,与未处理的含噪语音相比,使用文中方法生成的增强语音质量和可懂度平均提升了61%和7.93%。  相似文献   

14.
为了充分利用含噪语音特征来提高语音增强网络的性能,基于含噪语音在时间和频率两个维度上的相关性,本文结合卷积神经网络的局部特征提取能力和门控循环单元的长期依赖建模能力,设计了一种适用于语音增强的卷积门控循环网络.该网络采用卷积网络结构代替全连接网络结构来改进门控循环单元中的特征计算过程,从而能够更好地保留含噪语音特征中的时频结构信息.实验结果表明,与其它语音增强网络相比,本文网络在语音成分的保留和噪声成分的抑制上具有明显优势,增强后语音具有更好的语音质量和可懂度.  相似文献   

15.
陈楠  鲍长春 《电子学报》2019,47(1):227-233
借助双耳线索编码原理,通过构建一个语音和噪声的双耳线索先验码书,本文提出一种单通道语音增强方法.首先,该算法将语音和噪声的双耳线索作为语音和噪声的先验知识,在线下被训练成为先验码书.之后,在线上通过加权码书映射(Weighted CodeBook Mapping,WCBM)算法估计纯净线索参数,最后,利用双耳线索编码原理增强含噪语音.此外,本文采用深度神经网络,即堆栈式自编码器(Stacked Auto-Encoders,SAE)代替WCBM算法估计纯净线索参数,提出了基于深度神经网络的双耳线索语音增强算法.进一步提高了增强算法的性能.客观测试结果表明,本文所提方法优于参考算法.  相似文献   

16.
时文华  张雄伟  邹霞  孙蒙 《信号处理》2019,35(4):631-640
针对传统的神经网络未能对时频域的相关性充分利用的问题,提出了一种利用深度全卷积编解码神经网络的单通道语音增强方法。在编码端,通过卷积层的卷积操作对带噪语音的时频表示逐级提取特征,在得到目标语音高级特征表示的同时逐层抑制背景噪声。解码端和编码端在结构上对称,在解码端,对编码端获得的高级特征表示进行反卷积、上采样操作,逐层恢复目标语音。跳跃连接可以很好地解决极深网络中训练时存在的梯度弥散问题,本文在编解码端的对应层之间引入跳跃连接,将编码端特征图信息传递到对应的解码端,有利于更好地恢复目标语音的细节特征。 对特征融合和特征拼接两种跳跃连接方式、基于L1和 L2两种训练损失函数对语音增强性能的影响进行了研究,通过实验验证所提方法的有效性。   相似文献   

17.
为提高语音通信系统在噪声环境下的使用性能,该文提出一种基于子带谱减与广义旁瓣抵消的双微阵列语音增强方法。基于双微阵列及子带结构分析,首先分别在低频带采用可变过减因子谱减法抑制噪声,在高频带采用修改互功率谱谱减法抑制非相干性噪声部分,再结合广义旁瓣抵消与端点检测进一步抑制强相关性噪声的影响。实验结果表明,该方法能够更加有效地抑制噪声的影响并提高语音的可懂度。  相似文献   

18.
提出了一种噪声功率谱估计算法,该算法对加权后的带噪语音进行递归平滑,可以持续更新噪声并可应用于非平稳噪声环境中。为了避免在强语音后的弱语音区域出现噪声过估计,本文提出了用于计算加权函数的投影平滑算法。本文噪声估计算法可以快速跟踪噪声的变化并且没有过估计。实验结果表明,本文噪声估计算法应用于一个语音增强系统时,取得了较小的噪声分段估计误差及较好的感知语音质量评价(PESQ)得分。  相似文献   

19.
该文结合短时谱估计算法和人耳掩蔽效应提出了一种单通道语音增强算法。该算法在MMSE准则下采用了非固定参数的语音跟踪,并且引入人耳掩蔽效应动态的确定增强滤波器的传递函数以适应语音信号的变化。实验结果表明:该算法使降噪后的语音信号有较小的语音失真并且很好地抑制了音乐噪声。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号