共查询到17条相似文献,搜索用时 250 毫秒
1.
《计算机应用与软件》2014,(1)
谱减法是目前减少噪声干扰、提高语音质量的一种有效方法。为了进一步提高谱减法的去噪性能,提出一种基于TEO(Teager Energy Operator)能量的改进谱减法。该方法利用TEO能量对带噪语音进行语音活动检测,区别出噪声段和语音段,对噪声段和语音段分别进行谱减处理,既保证了语音质量,又尽可能地消除了噪声干扰。在F16战斗机噪声环境中对算法性能进行测试,结果表明,该方法提高了输出信噪比,抑制了音乐噪声,具有良好的语音增强效果。 相似文献
2.
基于人类听觉特性的Mel频率倒谱系数广泛用于声音识别,然而在生态环境中噪声的出现导致其识别率剧减。提出一种在噪声背景下生态环境声音分类方法。利用非线性多频带谱减法对声音功率谱进行去噪处理并提取改进Mel频率倒谱系数,有效削弱不同频率段噪声功率谱干扰。利用支持向量机良好的鲁棒性和抗噪能力对含有噪声的生态环境声音进行分类。实验表明该方法能有效在噪声背景下对生态环境声音准确分类。 相似文献
3.
传统的谱减法无法有效地抑制实际语音通信中的非平稳噪声,为了进一步提高谱减法的去噪性能,提出了一种改进的噪声估计算法,首先将带噪语音的功率谱按照Bark频率进行子带划分,然后分别在每个子带内利用改进的最小统计量控制递归平均方法跟踪噪声的变化,从而在准确估计非平稳噪声的功率谱的同时减少计算量。将该算法应用到谱减法中,并与传统的增强型谱减法进行对比实验,实验结果表明:改进的谱减法能够更好地去除各种非平稳噪声,而且能够有效抑制“音乐噪声”,使得增强后的语音具有更好的音质。 相似文献
4.
提出一种可适应非平稳噪声环境的基于码本学习的改进谱减语音增强算法。该算法分为训练阶段和增强阶段。训练阶段,使用自回归模型对语音和噪声的频谱形状进行建模并构造语音和噪声码本;增强阶段,采用对数谱最小化算法估计出语音和噪声的频谱,通过谱相减消除噪声。算法在每个时间帧估计语音和噪声频谱,即使在语音存在时仍能够有效跟踪快速变化的非平稳噪声;采用自回归模型能得到噪声频谱的平滑估计,减少了音乐噪声。实验仿真表明,相比于传统谱减法和多带谱减法,改进的谱减法具有更好的噪声抑制性能并且语音失真更小。 相似文献
5.
针对语音系统受外界强噪声干扰而导致识别精度降低以及通信质量受损的问题,提出一种基于自适应噪声估计的语音增强方法。通过端点检测将语音信号分为语音段与非语音段,对这两种情况的噪声幅度谱分别进行自适应估计,并对谱减法中不具有通用性的假设进行研究从而改进原理公式。实验结果表明,相对于传统谱减法,该方法能更好地抑制音乐噪声,并保持较高清晰度和可懂度,提高了强噪声环境下的语音识别精度和通信质量。 相似文献
6.
针对低信噪比条件下基本谱减算法存在降噪效果不佳,产生音乐噪声过大,语音可懂度不高的问题,提出了一种改进型的谱减算法。算法先计算语音信号的倒谱距离值,检测出噪音段和语音段,用动态计算的噪声值代替基本谱减法采用的噪声统计均值;根据当前帧和噪声帧的倒谱距离比值动态设置谱减系数,改进了传统算法中谱减系数保持不变的缺点;同时采用三种方法抑制音乐噪声。仿真实验表明,在低信噪比情况下,改进型的谱减算法可以有效降噪,提高信噪比和可懂度,达到语音增强的目的。 相似文献
7.
《计算机应用与软件》2017,(3)
为减少维纳滤波在语音增强中残留的"音乐噪声",将多窗谱估计和改进的维纳滤波方法结合,并进行语音合成。设计了基于多窗谱估计的改进维纳滤波语音增强方法,该方法采用多窗谱估计噪声功率谱,改进维纳滤波降噪得到增强语音,以及重叠相加语音合成,并给出仿真对比验证。结果表明,基于多窗谱估计的改进维纳滤波方法在抑制噪声,减少音乐噪声方面优于基于维纳滤波的增强算法和基于多窗谱估计的改进谱减法的增强算法。 相似文献
8.
语音中存在加性噪声降低了MFCC参数的鲁棒性,使得说话人确认系统性能下降。多窗谱MFCC引入了多窗谱估计技术在增强 MFCC 特征的噪声鲁棒性上取得了一定效果,但改善的程度有限。为了使 MFCC 参数对噪声具有更强的鲁棒性,提出了一种改进的多窗谱 MFCC 提取算法。改进算法在多窗谱 MFCC 的基础上引入谱减思想,谱减法(Spectral Subtraction, SS)能够增强语音并降低噪音的干扰。因此,采用了Multitaper+SS组合的改进算法融合了两者的优势,具备了更好的性能。仿真结果表明,当测试语音中含有加性噪声时,与多窗谱 MFCC提取算法相比,采用改进的多窗谱 MFCC 的说话人确认系统性能在等错误率 EER 和最小检测代价函数值minDCF两项评测指标上都取得了更好的结果。 相似文献
9.
针对传统谱减法存在的算法缺陷,提出一种基于联合最大后验概率的改进谱减法.传统谱减法通过获取带噪语音与噪声的幅度差值,并提取带噪语音的相位信息进行语音信号重建.该方法因为谱相减产生“音乐噪声”,并因为相位估计不准确,导致低信噪比下信号增强效果不理想.为此,引入多频带谱减法和相位估计,通过划分频谱,分别在子频带进行谱减法,有效降低“音乐噪声”的影响;同时构建基于最大后验概率的相位估计器,联合信号幅度函数和相位函数,通过多次交替迭代得到相位估值.实验结果表明,相对于传统谱减法,在低信噪比下该算法有效提高增强语音的质量感知和可懂度. 相似文献
10.
谱减法是处理宽带噪声较为传统和有效的方法,它运算量较小,容易实时处理,增强效果也较好。根据经典谱减法及其各种改进形式的基本原理,提出一种新的改进谱减法语音增强算法。根据语音和噪声各自的特性,对带噪语音进行时域平滑和频谱统计加权处理。对该算法进行客观和主观测试表明:相对于传统的谱减法,该算法能更好地抑制背景噪声和音乐噪声,同时也较好地保持了语音的可懂度和自然度。 相似文献
11.
提出了一种新的噪音估计及非线性谱相减方法,通常的噪音估计一般基于语音检测方法,取噪音段的谱平均作为噪音谱的估计,该方法在信噪比较低时性能下降严重。提出的基于能量聚类的噪音谱估计方法,不依赖于语音检测直接估计噪音谱,提高了噪音谱估计的精度。还在一般非线性谱相减方法的基础上提出了改进的谱相减方法,该方法根据单个mel滤波器频带内局部的信噪比,来决定该频段内非线性谱相减的多少,细化了非线性差谱的额度,在有效抑制噪声的同时减少了语音谱的失真。 相似文献
12.
分析和研究了基于声波耦合和语音增强模块级联的语音增强方法的工业语音识别系统设计和实施过程,并对其进行了算法建模,同时在比较谱减法和MMSE-LSA的语音增强算法的同时进行了实验数据分析,使工业机器人语音识别系统在噪声环境下提高了识别率。 相似文献
13.
谱减法是目前有效的增强语音信号质量的技术之一,低信噪比下降噪效果明显,而LMS自适应滤波算法收敛速度慢,步长需在收敛速度和失调折中选择。提出了先经过谱减法然后采用变步长LMS自适应滤波算法联合去噪来提高信号质量,通过改变误差的平方项来调节步长,步长采用先固定后变化的原则,兼顾了提高收敛速度和缩小稳态误差。在MATLAB 环境下进行仿真实验,测试结果表明提出的经过基本谱减法后再采用变步长LMS自适应滤波算法能有效消除背景噪声,信噪比SNR和PESQ分值得到了较大的提高,减少了原始语音信号的失真,提高了信号质量。 相似文献
14.
提出了一种基于改进的谱减法的语音增强算法。该算法首先利用了一种由最小值控制的递归平均的噪声谱估计算法,因而无需语音端点检测,其次利用一种通过递归计算得到的基于子带信噪比的过减因子,减小了产生“音乐噪声”的可能性。分析和实验表明,提出的算法对“音乐噪声”起到了一定的抑制效果,并有效地提高了输出信噪比。 相似文献
15.
针对外部强噪声环境下电子耳蜗语音质量受损、适应性差等问题,提出了基于谱减法和变步长最小均方误差(LMS)自适应滤波算法联合去噪的改进方法,并以该方法构建了一个电子耳蜗前端语音预处理系统。利用变步长LMS自适应滤波算法输出误差的平方项来调节步长,采用步长值固定与变化相结合的方法,解决了自适应滤波算法收敛速度慢、稳态误差大的问题,适应性得到提高,提高了语音信号通信质量。该系统以TMS320VC5416和音频编解码芯片TLV320AIC23B为核心,通过多通道缓冲串口(McBSP)和串行外设接口(SPI)实现了语音数据的高速采集和实时处理。实验仿真和测试结果表明该算法消除噪声性能好,信噪比在低输入信噪比情况下提高约10 dB,语音质量感知评价(PESQ)分值也得到较大提高,能有效提高语音信号质量,且该系统性能稳定,能进一步提高耳蜗前端语音的清晰度和可懂度。 相似文献
16.
Bojan Kotnik Damjan Vlaj Bogomir Horvat 《International Journal of Speech Technology》2003,6(3):205-219
The evolution of robust speech recognition systems that maintain a high level of recognition accuracy in difficult and dynamically-varying acoustical environments is becoming increasingly important as speech recognition technology becomes a more integral part of mobile applications. In distributed speech recognition (DSR) architecture the recogniser's front-end is located in the terminal and is connected over a data network to a remote back-end recognition server. The terminal performs the feature parameter extraction, or the front-end of the speech recognition system. These features are transmitted over a data channel to the remote back-end recogniser. DSR provides particular benefits for the applications of mobile devices such as improved recognition performance compared to using the voice channel and ubiquitous access from different networks with a guaranteed level of recognition performance. A feature extraction algorithm integrated into the DSR system is required to operate in real-time as well as with the lowest possible computational costs.In this paper, two innovative front-end processing techniques for noise robust speech recognition are presented and compared, time-domain based frame-attenuation (TD-FrAtt) and frequency-domain based frame-attenuation (FD-FrAtt). These techniques include different forms of frame-attenuation, improvement of spectral subtraction based on minimum statistics, as well as a mel-cepstrum feature extraction procedure. Tests are performed using the Slovenian SpeechDat II fixed telephone database and the Aurora 2 database together with the HTK speech recognition toolkit. The results obtained are especially encouraging for mobile DSR systems with limited sizes of available memory and processing power. 相似文献
17.
王景芳 《计算机工程与应用》2011,47(20):147-150
提出了一种适应复杂环境下的高效的实时语音端点检测算法,给出了每帧声信号在滤波中的噪声功率谱的推算方法。先将每帧语音的频谱进行迭代维纳滤波,再将它划分成若干个子带并计算出每个子带的频谱熵,然后把相继若干帧的子带频谱熵经过一组中值滤波器获得每帧的频谱熵,根据频谱熵的值对输入的语音进行分类。实验结果表明,该算法能够有效地区分语音和噪声,可以显著地提高语音识别系统的性能,在不同的噪声环境条件下具有鲁棒性。该算法计算代价小,简单易实现,适合实时语音识别系统的应用。 相似文献