首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
先验信噪比单通道语音增强算法在信噪比较高时能有效地去除噪声,但在信噪比较低时语音高次谐波失真较为严重。针对此提出了一种基于谐波重构的先验信噪比估计算法,对增强后的信号加权求平方,进行功率谱的二次谱处理,以加强语音信号的周期性;再进行谐波重构,提升谐波分量。实验研究表明,该算法在低信噪比时能够有效地增强语音谐波分量,相对于先验信噪比估计的语音增强算法能够改善语音质量,减少语音失真。  相似文献   

2.
针对DD(Decision-Directed)先验信噪比估计方法在处理语音时产生延迟以及非因果先验信噪比估计算法不具实时性的缺点,提出一种MMSE(Minimum Mean Square Error)先验信噪比估计方法。它在高斯语音模型假设的基础上,运用最小均方误差准则直接从带噪信号中估计先验信噪比。通过对增强语音信噪比、Itakura-Saito失真测度以及信号时域图和语谱图仿真,结果表明,该算法比DD算法能更好地抑制“音乐噪声”和防止语音畸变,且相对于非因果先验信噪比估计算法具有更强实时性。  相似文献   

3.
语音和噪声的时频相关特性研究表明,"音乐噪声"区别于语音的一个重要特征是"音乐噪声"谱时频不相关.根据这一特点,在传统先验信噪比估计相关统计模型基础上给出了两点相关性补充假设.在此基础上,通过改进对数谱最小均方误差语音增强(LSA-MMSE)算法中的D-D先验信噪比估计,提出了改进对数谱最小均方误差语音增强算法.仿真实验采用了主观综合评分测度(MOS)和MBSD两种评价机制,实验结果表明,新模型和算法可以有效地抑制"音乐噪声"现象.  相似文献   

4.
安扣成 《计算机应用》2012,32(Z1):29-31,35
针对语音增强算法残留“音乐噪声”的问题,分析了基于先验信噪比估计的语音增强算法,并在此基础上提出自适应先验信噪比估计与增益平滑相结合的方法.这种方法先对先验信嗓比进行估计,然后对增益函数进行平滑,减小相邻增益函数的随机跳变,弥补了传统先验信噪比估计的不足.最后对含高斯白噪声的语音信号进行处理,仿真结果表明,该算法在抑制“音乐噪声”的效果上得到一定改善,提高了语音增强的性能.  相似文献   

5.
利用递归平均和谱减技术的语音增强方法   总被引:3,自引:2,他引:1       下载免费PDF全文
提出了一种基于改进的谱减法的语音增强算法。该算法首先利用了一种由最小值控制的递归平均的噪声谱估计算法,因而无需语音端点检测,其次利用一种通过递归计算得到的基于子带信噪比的过减因子,减小了产生“音乐噪声”的可能性。分析和实验表明,提出的算法对“音乐噪声”起到了一定的抑制效果,并有效地提高了输出信噪比。  相似文献   

6.
葛宛营  张天骐 《计算机应用》2019,39(10):3065-3070
单通道语音增强算法通过从带噪语音中估计并抑制噪声成分来得到增强语音。然而,噪声估计算法在计算时存在过估现象,导致部分估计噪声能量值比实际值大。尽管可以通过补偿消去这些过估值,但引入的误差同样会降低增强语音的整体质量。针对此问题,提出一种基于计算听觉场景分析(CASA)的时频掩蔽估计与优化算法。首先,通过直接判决(DD)算法估计先验信噪比(SNR)并计算初始掩蔽;其次,利用噪声与带噪语音在Gammatone频带内的互相关(ICC)系数来计算噪声的存在概率,结合带噪语音能量谱得到新的噪声估计,减少原估计噪声中的过估成分;然后,利用优化算法对初始掩蔽进行迭代处理以减少其中因噪声过估而存在的误差并增加其中的目标语音成分,在满足条件后停止迭代并得到新的掩蔽;最后,利用新的掩蔽合成增强语音。实验结果表明在不同的背景噪声下,相比优化前,新的掩蔽使增强语音获得了较高的主观语音质量(PESQ)和语音可懂度(STOI)值,提升了语音听感与可懂度。  相似文献   

7.
联合听觉掩蔽效应的子空间语音增强算法   总被引:1,自引:0,他引:1       下载免费PDF全文
在经典子空间语音增强算法中,因语音特征值估计偏差会造成语音失真和音乐噪声。针对该问题,提出一种联合听觉掩蔽效应的语音增强算法。该算法联合掩蔽阈值自适应调节噪声特征值的抑制系数,并利用维纳滤波对音乐噪声的抑制性,对该特征值并行修正,最终还原出纯净的语音。实验结果证明,该算法在白噪声和有色噪声的背景下,与经典子空间的语音增强算法相比,能提高信噪比,减少语音失真和音乐噪声。  相似文献   

8.
对于基于统计模型的语音增强算法,不同分布模型对应于不同的增益函数,由于语音信号的不确定性,没有一种分布函数能准确对语音和噪声谱的分布建模,因此任何一种固定的统计模型均会存在一定的误差。所以提出一种增益字典查询的语音增强算法,该算法通过采用对数谱失真准则对一个语音噪声库进行增益的训练,得到一个增益的字典,其中输入为先验信噪比和后验信噪比的估计值。最后采用ITU-T P.826 PESQ、分段信噪比、总信噪比和对数谱失真对该算法进行了测试,并与基于高斯分布模型、拉普拉斯分布模型的算法进行了对比。实验结果表明,该算法无论在非平稳噪声还是平稳噪声环境下都比其他几种算法增强效果好,且音乐噪声和残留背景噪声也可以得到很好的抑制。  相似文献   

9.
针对车载环境下语音系统受到外界强噪声的干扰而导致识别精度降低以及通信质量受损的问题,提出一种自适应MMSE-LSA估计与TEO(Teager Energy Operator)能量端点检测相结合的语音增强算法。TEO端点检测可以将语音分为语音段和非语音段,从而在噪声估计时可以更好地跟踪噪声的变化,得到更加准确的先后验信噪比,使增强后的语音最大限度地接近纯净语音,而且对车载噪声的增强效果比其他噪声更好。在车载环境中进行实验,结果显示该方法与MMSE-LSA以及传统的谱减法相比,提高了输出信噪比,减弱了音乐噪声,在可懂度和清晰度方面均具有优势。  相似文献   

10.
将非平稳噪声估计算法以及基于听觉掩蔽效应得到的噪声被掩蔽概率应用于维纳滤波语音增强中,提出了一种听觉掩蔽效应和维纳滤波的语音增强方法。几种噪声背景下对语音增强的客观测试表明,提出的算法相比较于传统的维纳滤波语音增强算法而言不但可以提高语音信噪比,而且可以明显减少语音失真。  相似文献   

11.
针对语音系统受外界强噪声干扰而导致识别精度降低以及通信质量受损的问题,提出一种基于自适应噪声估计的语音增强方法。通过端点检测将语音信号分为语音段与非语音段,对这两种情况的噪声幅度谱分别进行自适应估计,并对谱减法中不具有通用性的假设进行研究从而改进原理公式。实验结果表明,相对于传统谱减法,该方法能更好地抑制音乐噪声,并保持较高清晰度和可懂度,提高了强噪声环境下的语音识别精度和通信质量。  相似文献   

12.
提出一种可适应非平稳噪声环境的基于码本学习的改进谱减语音增强算法。该算法分为训练阶段和增强阶段。训练阶段,使用自回归模型对语音和噪声的频谱形状进行建模并构造语音和噪声码本;增强阶段,采用对数谱最小化算法估计出语音和噪声的频谱,通过谱相减消除噪声。算法在每个时间帧估计语音和噪声频谱,即使在语音存在时仍能够有效跟踪快速变化的非平稳噪声;采用自回归模型能得到噪声频谱的平滑估计,减少了音乐噪声。实验仿真表明,相比于传统谱减法和多带谱减法,改进的谱减法具有更好的噪声抑制性能并且语音失真更小。  相似文献   

13.
洪晓芬 《计算机工程与设计》2007,28(22):5453-5454,5477
语音增强技术是解决噪声污染的一项强有力的预处理技术.谱减法通过处理后的语音中会留下所谓的"音乐噪声",针对这个问题,提出了一种多带谱相减与感觉加权相结合的语音增强方法.对带噪语音进行多带谱相减,并根据人的听觉掩蔽特性,对多带谱相减后的信号进行感觉加权,从而进一步降低背景噪声.在语音失真和噪声抑制之间取得良好的折中,减少语音的听觉失真,有效地抑制"音乐噪声",提高语音的清晰度.  相似文献   

14.
In this paper, we proposed a new speech enhancement system, which integrates a perceptual filterbank and minimum mean square error–short time spectral amplitude (MMSE–STSA) estimation, modified according to speech presence uncertainty. The perceptual filterbank was designed by adjusting undecimated wavelet packet decomposition (UWPD) tree, according to critical bands of psycho-acoustic model of human auditory system. The MMSE–STSA estimation (modified according to speech presence uncertainty) was used for estimation of speech in undecimated wavelet packet domain. The perceptual filterbank provides a good auditory representation (sufficient frequency resolution), good perceptual quality of speech and low computational load. The MMSE–STSA estimator is based on a priori SNR estimation. A priori SNR estimation, which is a key parameter in MMSE–STSA estimator, was performed by using “decision directed method.” The “decision directed method” provides a trade off between noise reduction and signal distortion when correctly tuned. The experiments were conducted for various noise types. The results of proposed method were compared with those of other popular methods, Wiener estimation and MMSE–log spectral amplitude (MMSE–LSA) estimation in frequency domain. To test the performance of the proposed speech enhancement system, three objective quality measurement tests (SNR, segSNR and Itakura–Saito distance (ISd)) were conducted for various noise types and SNRs. Experimental results and objective quality measurement test results proved the performance of proposed speech enhancement system. The proposed speech enhancement system provided sufficient noise reduction and good intelligibility and perceptual quality, without causing considerable signal distortion and musical background noise.  相似文献   

15.
In this paper, we present a simultaneous detection and estimation approach for speech enhancement. A detector for speech presence in the short-time Fourier transform domain is combined with an estimator, which jointly minimizes a cost function that takes into account both detection and estimation errors. Cost parameters control the tradeoff between speech distortion, caused by missed detection of speech components and residual musical noise resulting from false-detection. Furthermore, a modified decision-directed a priori signal-to-noise ratio (SNR) estimation is proposed for transient-noise environments. Experimental results demonstrate the advantage of using the proposed simultaneous detection and estimation approach with the proposed a priori SNR estimator, which facilitate suppression of transient noise with a controlled level of speech distortion.  相似文献   

16.
深度神经网络(Deep neural networks,DNNs)依靠其良好的特征提取能力,在语音增强任务中得到了广泛应用。为进一步提高深度神经网络的语音增强效果,提出一种将深度神经网络和约束维纳滤波联合训练优化的新型网络结构。该网络首先对带噪语音幅度谱进行训练并分别得到纯净语音和噪声的幅度谱估计,然后利用语音和噪声的幅度谱估计计算得到一个约束维纳增益函数,最后利用约束维纳增益函数从带噪语音幅度谱中估计出增强语音幅度谱作为网络的训练输出。对不同信噪比下的20种噪声进行的仿真实验表明,无论噪声类型是否在网络的训练集中出现,本文方法都能够在有效去除噪声的同时保持较小的语音失真,增强效果明显优于DNN及NMF增强方法。  相似文献   

17.
针对OM-LSA(optimally modified log-spectral amplitude estimator)算法产生的残留噪声,提出了一种结合OM-LSA和小波阈值去噪的语音增强算法。首先,进行语音对数幅度谱估计;然后,估计残留噪声,利用带噪语音第一级小波系数和语音不存在时的增益函数进行估计,解决了常规方法对增强后语音噪声估计不准确的问题;最后,在小波域利用软阈值法对语音信号进行阈值处理。实验结果表明,提出的算法有效地去除了OM-LSA算法中的残余噪声,在分段信噪比(segmental signal-to-noise ratio,SegSNR)和对数谱失真(log-spectral distortion,LSD)等指标评价上有较大的提高。  相似文献   

18.
在实际应用中通常无法精确估计得到背景噪音谱,传统语音增强效果也随之大大降低。为弱化估计误差引入的干扰,在对数最小均方差估计器(LSA)语音增强方法基础上提出了一套切实可行的增强方案。引入信号检测自动机判别帧成分,针对帧与帧之间的不同特点采取不同级别的噪音抑制处理方案,对确定为噪音帧的部分进行进一步深度抑制,而语音帧部分则沿用改进的LSA方法。实验表明,使用方法能有效抑制背景噪音,特别当噪音谱估计误差较大情况下,相比于LSA该方法具有更优秀的去噪、抗干扰性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号