共查询到16条相似文献,搜索用时 171 毫秒
1.
利用短时过零率来检测清音,用短时能量来检测浊音,两者相配合便实现了信号信噪比较大情况下的端点检测。但是在信噪比较小的环境下,这两种方法便失去了作用。为了能在噪声环境下准确地检测出语音信号的端点,根据对含噪语音在时频域中的研究,提出了一种基于Matching pursuits时频分解算法的语音端点检测方法。该方法使用Matching pursuits算法对含噪信号进行分解,然后再对信号进行魏格纳变换,可以完全去除信号的魏格纳交叉干扰项,使得语音信号和噪声信号在时频平面上具有较直观明显的魏格纳能量分布,利用这个特点再进行端点检测,实验结果表明,该方法能在信噪比较低的情况下,准确地检测出语音信号的端点。 相似文献
2.
端点检测技术是语音信号处理的关键技术之一,为提高低信噪比环境下端点检测的准确率和稳健性,提出了一种非平稳噪声抑制和调制域谱减结合功率归一化倒谱距离的端点检测算法。该算法首先通过抑制非平稳噪声再采用调制域谱减消除残余噪声来提升信噪比,减少语音失真。然后再提取每帧信号的功率归一化倒谱系数,计算每帧信号与背景噪声的功率归一化倒谱距离。最后将该倒谱距离作为检测参数,采用双门限判决方法进行端点检测。实验结果表明,该端点检测算法对语音帧和噪声帧具有较好的区分性。此外,在低信噪比环境下,所提出的算法对于不同类型的噪声都具有较好的稳健性。 相似文献
3.
4.
5.
为了能在无噪音环境下准确地检测语音信号的端点,传统的方法是使用过零方法检测清音,短时能量方法检测浊音,两者相结合便实现了端点检测.通过对语音信号在时频平面中分布的研究,提出了一种基于匹配追踪时频原子分解算法的端点检测方法.该方法利用匹配追踪算法对信号进行分解,使得信号在时频平面上具有较直观明显的魏格纳能量分布,利用这个特点设置一个门限值再进行端点检测,便能准确检测出语音信号端点.实验结果表明,和传统的方法相对比,因为涉及到了信号的分解,所以实时性较差,且门限问题还有待深人研究,但该方法能更加准确地检测出语音信号的端点,亦为端点检测问题提供了一种新的思维方法. 相似文献
6.
匹配追踪时频分解算法的端点检测方法 总被引:2,自引:0,他引:2
为了能在无噪音环境下准确地检测语音信号的端点,传统的方法是使用过零方法检测清音,短时能量方法检测浊音,两者相结合便实现了端点检测。通过对语音信号在时频平面中分布的研究,提出了一种基于匹配追踪时频原子分解算法的端点检测方法。该方法利用匹配追踪算法对信号进行分解,使得信号在时频平面上具有较直观明显的魏格纳能量分布,利用这个特点设置一个门限值再进行端点检测,便能准确检测出语音信号端点。实验结果表明,和传统的方法相对比,因为涉及到了信号的分解,所以实时性较差,且门限问题还有待深入研究,但该方法能更加准确地检测出语音信号的端点,亦为端点检测问题提供了一种新的思维方法。 相似文献
7.
8.
噪声谱估计是单通道语音增强算法的关键步骤,当前大部分语音增强算法旨在提高语音质量,提高语音可懂度的算法却很少。在传统的单通道语音增强算法中,语音质量的提高往往是以牺牲语音的可懂度为代价的。对目前主流的几种噪声谱估计算法对语音可懂度影响进行分析。在不同噪声背景、不同信噪比情况下进行噪声谱估计,并采用谱减法对含噪语音信号作去噪处理,对比分析不同噪声、不同信噪比下增强前后语音的短时客观可懂度(Short-Time Objective Intelligibility,STOI)值,最后根据信噪比,对比分析了不同噪声环境下,语音增强前后语音能量高于噪声能量的时频块所占比例。实验表明,相比其他噪声估计算法,最小统计(Minima Statistics,MS)算法由于保留了更多的以语音能量为主的时频块,使得去噪后的语音有较高的可懂度。 相似文献
9.
在研究单边自相关序列(One-sided autocorrelation,OSA)和相对自相关序列(Relative autocorrelation sequences,RAS)的基础上,提出了一种基于相对自相关序列的语音信号的端点检测算法。该方法利用相对自相关算法能够消除噪声的原理,以语音信号相对自相关序列短时平均幅度代替双门限比较法中的语音信号短时平均幅度,以语音信号短时平均幅度代替语音信号的短时平均过门限率,实验表明,在低信噪比下检测精度要高于传统的双门限比较法。 相似文献
10.
语音活性检测是语音增强中的一个重要问题。大部分的语音活性检测方法都是建立在相对理想的实验室条件下的.要求背景噪声保持平稳,信噪比较高,这些条件在实际噪声环境中很难满足。本文提出的基于Mel刻度短时能量差的语音活性检测算法,距离测度简单,物理意义叫确,在低信噪比、缓变非平稳噪声环境下,标定准确,鲁棒性好。将其应用在维纳滤波语音增强中的噪声特性估计上,取得了较为理想的效果。 相似文献
11.
12.
单通道语音信号在信噪比较大的环境下经过增强后再识别,能表现出较高的识别率。但是在低信噪比环境下,增强后语音信号的识别率急剧下降。针对此种情况,提出了一种用在识别系统前端的语音增强算法,该增强算法将采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimum Mean Square Error,Log MMSE)提高其信噪比,然后再利用改进的维纳滤波去除噪声残留并提升语音可懂度,最后用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔科夫模型(Hidden Markov Model,HMM)对增强后的语音信号做特征提取并识别。实验分析结果表明,该方法能有效地抑制背景噪声并减少噪声残留,显著提升低信噪比环境下语音识别的准确性。 相似文献
13.
Han‐Gyu Kim Gil‐Jin Jang Jeong‐Sik Park Ji‐Hwan Kim Yung‐Hwan Oh 《International journal of imaging systems and technology》2013,23(1):64-70
This article proposes a novel speech and sound segregation framework incorporating a technique for correcting a series of pitch periods based on particle filtering. The conventional pitch track correction method finds the peak locations of the autocorrelation functions to estimate the pitch period, and only the longest reliable pitch streak is used to correct unreliable pitch tracks. Especially in noisy environments, it is hard to find long and reliable pitch streaks, resulting in the degradation of the speech segregation performance. The proposed algorithm based on particle filtering considers all the reliable pitch streaks rather than the longest one and smoothly connects the scattered pitch streaks. To apply the particle filtering algorithm to pitch track correction, the importance weight computation to account for the degree of matchness of the found pitch to the individual spectro‐temporal components is also proposed. The performance of the proposed method is evaluated by the results of speech segregation experiments for the mixtures of speech and various noise sources in various mixing signal‐to‐noise ratios (SNRs). The evaluation measures were SNR, energy loss ratio, and noise residue ratio of the segregated speech, and all these measures showed that the proposed segregation method achieved superior performance compared to the conventional approach. © 2013 Wiley Periodicals, Inc. Int J Imaging Syst Technol, 23, 64–70, 2013. 相似文献
14.
针对传统最小均方误差谱幅度估计(MMSE—STSA.minimum mean-square error-short time spectral amplitude)语音增强算法无法有效的跟踪非平稳噪声变化的问题,对一种改进的MMSE-STSA语音增强算法进行了研究和仿真。该算法对背景噪声的估计利用加权噪声估计方法:采用一个非线性函数根据带噪语音信噪比(SNR.signal—to-noise ratio)的变化计算得到相应的加权因子并作用于带噪语音信号,对加权的带噪语音求平均得到估计的背景噪声。算法中的谱增益修正,还可以抑制低信噪比时的残留噪声以及避免对带噪语音的过抵消。实验结果表明,该方法能很好的跟踪非平稳噪声的变化,不仅在增强性能上有很好的效果,同时降低了语音的失真。 相似文献
15.
16.
针对噪声环境下语音识别率急剧下降的问题,提出了一种基于语音时频域稀疏性原理的改进最小方差无畸变响应波束形成与改进维纳滤波结合的算法。该算法首先利用麦克风阵列语音信号的空间信息,通过基于时频掩蔽的改进最小方差无畸变响应波束形成器,增强目标声源方向的语音信号,抑制其他方向噪声的干扰,然后再使用改进的维纳滤波器去除残留噪声并提高语音可懂度,对增强后的语音信号提取梅尔频率倒谱系数作为特征参数,使用隐马尔可夫模型搭建语音识别系统。实验结果表明,该方法能够有效提高低信噪比环境下的语音识别率,具有较好的鲁棒性。 相似文献