首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 188 毫秒
1.
为了提升复杂噪声环境下语音增强效果,该文提出了一种基于双层字典学习的单通道语音增强方法。在训练阶段首先采用干净语音和噪声训练初始化特征子字典,然后基于区分性约束和抗混淆约束的优化函数训练双层联合字典,第一层字典表达语音信号和噪声的可区分分量,而第二层字典表达语音信号和噪声的易混淆成分。在测试阶段含噪语音在双层联合字典上投影得到稀疏系数矩阵,然后重构得到增强后的语音。该方法利用目标优化函数的约束性减少"交叉投影"现象的发生,降低了信号在联合字典的混淆,从而进一步提升了语音增强的效果。实验结果表明,从语谱图、全局信噪比(SNR)、主观语音质量评估(PESQ)和对数频谱距离(LSD)四个方面评价,相比于基于稀疏约束非负矩阵分解和改进的维纳滤波的语音增强方法,该方法具有更好的性能,能够更有效地去除噪声。  相似文献   

2.
张天骐  柏浩钧  叶绍鹏  刘鉴兴 《信号处理》2021,37(10):1986-1995
针对卷积编解码网络(CED, Convolution encoder-and-decoder)对语音时序相关信息捕获困难的问题,本文提出了一种基于门控残差卷积编解码网络的语音增强方法。该方法在卷积编解码网络的基础上引入了门控机制、膨胀卷积与残差连接:门控机制能够很好地处理序列前后相关信息;膨胀卷积使得卷积过程获得更大的感受野,提取更加丰富的全局信息;残差连接能够防止梯度消失与梯度爆炸,提升网络精度。此外,采用频域损失函数与时域评价指标联合优化的策略对网络进行训练,以进一步提升网络增强效果。实验表明,在匹配噪声和不匹配噪声下,相比于基线CED与其他对比方法,本文方法取得了更高的PESQ、STOI与SI-SDR,对语音的清浊音都有较好恢复效果,且具有较强的泛化能力。   相似文献   

3.
语音增强技术就是要抑制噪声,从带噪语音信号中尽可能的提取纯净的语音信号,提升其可懂度和清晰度。神经网络能够模拟人脑的工作原理,具有自学习能力和强大的非线性映射能力,故采取BP神经网络以及深度学习两种主流模型来展开研究,在此基础上研究了基于深度学习的反馈网络语音增强方法。通过对神经网络重复预训练和自学习,使之可以实现从带噪语音幅度谱到噪声幅度谱的非线性映射,同时训练了多个阈值和权重下的深度网络。通过真并对比其性能取得了很好的去噪效果。  相似文献   

4.
针对低光照条件下拍摄图像质量低下的问题,该文提出一种基于双重迭代的零样本低照度图像增强方法。其外层迭代通过卷积神经网络估计增强参数,再由内层迭代进行图像增强,增强结果进一步用于计算损失函数并反馈更新外层的参数估计网络,最终通过多轮迭代生成高质量的图像。在该框架下,还设计了多尺度增强系数估计模块、基于注意力的像素级大气光估计模块,并提出了基于亮度对比度、大气光、颜色均衡以及图像平滑性先验的无监督损失函数。大量实验结果表明,该方法可有效将低光照图像增强为高质量的清晰图像,其性能优于现有的同类方法。同时该方法基于零样本学习,不需任何训练数据集,具有良好的普适性。  相似文献   

5.
王骞  何培宇  徐自励 《信号处理》2020,36(6):902-910
针对现有深度神经网络语音增强方法对带噪语音的去噪能力有限、语音质量提升不高的问题,提出了一种基于奇异谱分析的深度神经网络语音增强方法。通过引入奇异谱分析算法对带噪语音进行预处理,以初步分离得到语音信号与噪声。接着将语音信号与噪声用于深度神经网络模型得训练,以得到性能更优的网络模型,从而使得本文方法具有更好的性能。最后在重建干净语音的环节中,同时使用神经网络估计得到的对数功率谱和带噪语音的对数功率谱,并加入了权重系数,使得本文提出的方法可以适应不同信噪比的情形,有效的去除背景噪声,降低语音信号的失真。本文通过仿真实验验证了该方法的有效性和鲁棒性。   相似文献   

6.
张天骐  张晓艳  周琳  胡延平 《信号处理》2020,36(11):1867-1876
相位谱补偿语音增强算法通过调整相位谱对噪声进行压缩,提高重构信号的质量。针对传统的相位谱补偿(phase spectrum compensation, PSC)语音增强算法采用固定的相位补偿因子,且算法的性能易受噪声估计准确性的影响,提出了一种基于稀疏性的相位谱补偿(sparsity-based phase spectrum compensation, SPSC)语音增强算法。首先,利用噪声估计算法得到噪声幅度谱,利用基于幅度谱的语音增强算法得到目标语音幅度谱;接着,通过噪声和目标语音幅度谱之间的局部信噪比(Signal-to-Noise Ratio, SNR)来估计谱时间稀疏性;然后,利用sigmoid函数改进相位补偿因子,联合补偿因子和谱时间稀疏性,得到SPSC函数。最后,使用SPSC函数对相位谱中的谱分量进行补偿,通过短时傅里叶逆变换得到最终增强后的语音信号。仿真实验表明,在四种不同背景噪声的低信噪比下,新的相位谱补偿算法使增强语音获得了更好的LSD、PESQ和segSNR指标,说明新的算法在低信噪比下,可以有效恢复带噪语音中的语音成分,对噪声抑制效果明显,增强语音的质量和听感均有一定提升。   相似文献   

7.
基于听觉感知的LSA-MMSE改进型语音增强方法   总被引:3,自引:0,他引:3  
传统增强方法的增益函数对每个频点都进行估计,必然会引进相对较多的语音失真.为了提高低信噪比下的语音增强效果,提出了一种计算掩蔽概率的方法,得到优化的语音增强方法.基于听觉感知特性,对噪声被掩蔽部分的带噪语音谱和未掩蔽部分采用不同处理方法.增强后的语音可以表示为这两个状态下单独估计的加权和,其中权重与噪声被掩蔽概率有关.通过与Virag的方法、LSA-MMSE估计等方法进行比较,实验结果表明所提的增强方法能在低信噪比下有效地抑制残留噪声的同时保持更小的语音失真.  相似文献   

8.
如何提高对未知噪声类型的泛化能力是有监督语音增强方法中亟待解决的重要问题,通过对大量不同类型噪声进行建模,深度神经网络成为了解决该问题的有效手段.为了进一步提高基于深度神经网络的语音增强方法的泛化能力,本文基于生成式对抗网络(Generative Adversarial Networks,GAN)设计了能够由真实噪声数据生成新的噪声类型的NoiseGAN;通过在训练集中增加生成噪声类型,提高训练集噪声类型的多样性,从而达到提高语音增强模型泛化能力的目的.不同结构的网络下的语音增强实验结果表明,本文提出的NoiseGAN能够生成新的噪声类型,具备提高训练集噪声类型多样性的能力,有效提高了语音增强模型在未知噪声类型下的泛化能力.  相似文献   

9.
时文华  张雄伟  邹霞  孙蒙 《信号处理》2019,35(4):631-640
针对传统的神经网络未能对时频域的相关性充分利用的问题,提出了一种利用深度全卷积编解码神经网络的单通道语音增强方法。在编码端,通过卷积层的卷积操作对带噪语音的时频表示逐级提取特征,在得到目标语音高级特征表示的同时逐层抑制背景噪声。解码端和编码端在结构上对称,在解码端,对编码端获得的高级特征表示进行反卷积、上采样操作,逐层恢复目标语音。跳跃连接可以很好地解决极深网络中训练时存在的梯度弥散问题,本文在编解码端的对应层之间引入跳跃连接,将编码端特征图信息传递到对应的解码端,有利于更好地恢复目标语音的细节特征。 对特征融合和特征拼接两种跳跃连接方式、基于L1和 L2两种训练损失函数对语音增强性能的影响进行了研究,通过实验验证所提方法的有效性。   相似文献   

10.
基于噪声被掩蔽概率的优化语音增强方法   总被引:9,自引:0,他引:9  
利用听觉系统的掩蔽特性,提出了一种优化的语音增强方法。研究表明,噪声被语音掩蔽的概率是噪声强度和听觉掩蔽阈值的函数。考虑到噪声在带噪语音中的出现具有不确定性,各语音谱分量的最终估计由对带噪语音的谱分量和用传统的增强方法估计的谱分量的加权求得,加权因子由噪声被掩蔽概率确定。语音增强性能的评估结果表明,这种优化的语音增强方法在减少语音失真与加强噪声抑制之间取得了良好的折衷,减少了语音的听觉失真, 有效地抑制了音乐噪声,提高了增强语音的清晰度。  相似文献   

11.
为了充分利用含噪语音特征来提高语音增强网络的性能,基于含噪语音在时间和频率两个维度上的相关性,本文结合卷积神经网络的局部特征提取能力和门控循环单元的长期依赖建模能力,设计了一种适用于语音增强的卷积门控循环网络.该网络采用卷积网络结构代替全连接网络结构来改进门控循环单元中的特征计算过程,从而能够更好地保留含噪语音特征中的时频结构信息.实验结果表明,与其它语音增强网络相比,本文网络在语音成分的保留和噪声成分的抑制上具有明显优势,增强后语音具有更好的语音质量和可懂度.  相似文献   

12.
一种新的自适应语音增强系统   总被引:4,自引:0,他引:4  
针对自适应噪声对消(ANC)语音增强系统的性能高度依赖于参考信号的质量,任何原始语音信号泄漏到参考信号中,都会导致原始语音信号失真和噪声抵消性能恶化这一问题,本文提出一种对泄漏不敏感的附加随机噪声(ARN)自适应噪声对消语音增强系统。它通过在参考信号中加入一个低功率的宽带随机训练信号,然后用该训练信号作参考信号对噪声传输函数(NTF)进行自适应建模,并在使用自适应预测滤波器(APF)消除NTF自适应建模的语音信号干扰的同时,用补偿滤波器(CPF)来修正由APF引起的参考信号失真。计算机仿真表明,这种ARNANC语音增强系统在泄漏情况下能将原始语音信号从带噪语音信号中有效分离出来。  相似文献   

13.
提出了一种基于听觉掩蔽效应的语音增强算法。算法对含噪语音的增强包括谱减法语音增强和感知加权语音增强两个步骤,分别从客观和主观两方面来提高含噪语音的质量。在谱减法阶段考虑了语音和噪声谱的交叉项,有效地减少了增强语音中的残余噪声;在感知加权处理中充分利用了人耳的掩蔽效应,设计了感知加权滤波器,对谱减法增强后的语音进行滤波,进一步消除残余噪声。对算法进行了数值实验,实验结果表明该算法能有效提高含噪语音的质量,比传统的谱减法有较大改进。  相似文献   

14.
由于可以有效地提高频谱效率,能量效率与前程效率,云接入网络(C-RAN)被认为是未来第五代无线网络中的重要组成部分。不同于传统蜂窝网络,在云接入网络中,基带处理单元(BBU)被从基站分离,并聚合成一个中央计算云。无论如何,这些优化目标(频谱效率,能量效率,前程效率)在大多数情况下相互冲突,并且单个目标性能提升通常会导致其他目标性能的下降。据作者所知,在云接入网络中的多目标优化(MOO)问题,仍未被考虑过。在本文中,我们针对基于正交频分多址(OFDMA)的云接入网络,设计对应的联合优化算法以解决多目标优化问题。仿真结果显示,比起仅考虑单目标优化,本文提出的算法可以有效的解决不同优化目标之间的权衡,并且为云接入网络的资源分配提供一个新的方向。   相似文献   

15.
为改善旋翼飞机空地语音通信质量,针对旋翼飞机螺旋桨造成的幅度调制(Amplitude Modulation, AM)信号复杂多频干扰以及恶劣机舱背景噪声,提出了一种通信语音时频掩膜智能增强方法,从而实现对机舱噪声与复杂干扰的有效抑制。该方法首先对原始时域语音信号进行分帧与加窗,通过短时傅里叶变换获取幅度谱与相位谱;然后将原始幅度谱作为网络输入,采用深度神经网络分析其语音信号的特征,采用长短期记忆网络挖掘语音信号的时序上下文信息,实现对语音时频掩膜的准确估计,并将其用于增强原始幅度谱以得到网络输出;最后结合原始相位谱,通过逆短时傅里叶变换获得增强后的时域语音信号。仿真与实际测试表明,该方法可有效抑制旋翼飞机环境下的干扰噪声,提高通信语音信号质量。  相似文献   

16.
闫昭宇  王晶 《信号处理》2020,36(6):863-870
语音增强的目的是从带有噪声的语音中分离出纯净语音,实现语音的质量和可懂度的提高。近年来,采用有监督学习的深度神经网络已经成为了语音增强的主流方法。卷积循环网络是一种新型的神经网络结构,包含编码层、中间层、解码层三个主要模块,其已经在语音增强任务中取得了较好的效果。时频注意力机制是一个由数个相连的卷积层通过跳跃连接构成的简单网络模块,在训练过程中可以计算语音幅度谱特征图的非邻域相关性,从而更加有利于网络关注到语音的谐波特性。本文将时频注意力机制引入卷积循环网络的编码层和解码层中,实验结果表明,在不同信噪比条件下,该方法相比基线卷积循环网络能够进一步提高语音质量和可懂度,且增强后的语音信号可以保留更多的语谱谐波信息,实现更低程度的语音失真。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号