共查询到19条相似文献,搜索用时 156 毫秒
1.
2.
目前的语音端点检测算法大多不能适应背景噪声实时变化情况.针对这一问题,首先给出1个代表噪声变化的参数--最小Mel频带参数(MiMSB);然后给出改进的时频参数(TF)--增强时频参数(ETF),用于区分语音信号与噪声;最后基于这2个参数提出一种变噪声环境下的端点检测算法.实验证明,该算法在各种噪声环境下均能取得很好的性能. 相似文献
3.
4.
针对现有双通道语音活动检测(Voice Activity Detection, VAD)算法依赖于固定阈值难以在多种噪声环境下准确地检测语音和噪声,应用于手机消噪系统会造成语音失真或噪声消除不好等问题,该文提出一种基于神经网络的VAD算法,该算法以分频带能量差和归一化互通道相关为特征,采用神经网络对语音和噪声进行分类。在此基础上,将神经网络VAD与基于互通道信号功率比值的VAD相结合,提出一种新的适用于手机消噪系统的语音和噪声活动检测算法分别对语音和噪声进行检测,并以此进行噪声抑制处理,减少了消噪系统因VAD误判而造成的性能下降。实验结果表明,该处理方法在抑制背景噪声和减少语音失真等方面优于现有的消噪算法,对于方向性语音干扰也有很好的抑制效果。 相似文献
5.
6.
7.
8.
端点检测是语音识别系统中十分关键的一个步骤,它对整个语音系统识别的准确性有着至关重要的作用。针对目前端点检测算法在强背景噪声下存在的不足,通过引入HHT,提出了一种基于希尔伯特-黄变换的端点检测方法。该方法首先采用EMD分解出有限个IMF,然后对IMF进行Hilbert变换,将得到的IMF能量谱作为特征参数来进行语音信号的端点检测,仿真实验证明了该算法在强背景噪声下的有效性与稳健性。 相似文献
9.
一种基于支持向量机的含噪语音的清/浊/静音分类的新方法 总被引:10,自引:3,他引:7
本文将支持向量机(SVM)方法应用于语音信号的清/浊/静音检测中,提出并验证了一种在各种信噪比等级下将语音信号有效地分为清音、浊音和静音三类信号的新型分类算法.首先,在高信噪比情况下,本文采用了G.729B VAD中的四个差分参数作为SVM分类器的输入特征参数,进行了静音分类的对比实验,得到了优于G.729B VAD和BP神经网络传统算法的实验结果,说明引入这种机器学习方法做语音分类是可行的,并分析讨论了在核函数不同的情况下支持向量机在实验中所表现出的性能.其次,又讨论了在低信噪比条件下,如何通过对含噪语音建立统计模型,提取对噪音免疫的统计特征参数,并给出了一种对时变背景噪声自适应的估计方法.最后,通过在不同噪音环境下的对比实验结果,验证了本文所提出的算法在中低信噪比情况下的分类性能要优于其他传统算法. 相似文献
10.
在不增加信息量的前提下,对语音信号进行频带扩展,以提高语音的听觉质量,已经成为人们研究的热点.本文围绕语音信号频带扩展中的两个重要问题--谱包络的重建和宽带激励信号的产生,分析了传统基于矢量量化的频带扩展方法中的不足.文章中针对这两个问题,对谱包络的重建方法作了改进,并提出了一种新的宽带激励信号产生方法.实验结果均表明改进的算法明显优于传统算法. 相似文献
11.
An improved method based on minimum mean square error-short time spectral amplitude (MMSE-STSA) is proposed to cancel background noise in whispered speech. Using the acoustic character of whispered speech, the algorithm can track the change of non-stationary background noise effectively. Compared with original MMSE-STSA algorithm and method in selectable mode Vo-coder (SMV), the improved algorithm can further suppress the residual noise for low signal-to-noise radio (SNR) and avoid the excessive suppression. Simulations show that under the non-stationary noisy environment, the proposed algorithm can not only get a better performance in enhancement, but also reduce the speech distortion. 相似文献
12.
提出了一种基于高阶统计的改进型语音激活检测算法。相对于传统的语音激活检测算法,在语音信号存在不确定的条件下,利用LPC残差域的高阶统计属性量,作为语音/噪音信号的判决标准。综合引入的归一化偏度/峰度、偏峰比等高阶统计量和传统的噪音信号概率等一阶分析量,形成语音/噪音软判决机制,能够有效的识别带噪语音信号中的语音激活区域。计算机仿真结果表明,输入背景噪音为高斯噪音和类高斯噪音时,所提算法相对于传统算法的误判概率要低,且在低信噪比条件下,具有更好的识别性能。 相似文献
13.
14.
希尔伯特-黄变换是一种全数据驱动的自适应非平稳信号时频分析方法,但是在强噪声环境下语音信号的希尔伯特能量谱曲线波动较大,对语音端点检测造成很大的影响,该文提出了一种基于希尔伯特-黄变换和顺序统计滤波的检测方法。该方法将含噪语音信号进行经验模态分解,通过对固有模态函数进行自适应权重选取获得信号的希尔伯特能量谱,利用顺序统计滤波器对每帧的能量谱进行平滑处理作为语音/非语音的鉴别特征。实验结果表明,该方法适用于复杂噪声环境的端点检测,在低信噪比情况下仍然能够有效地检测出语音信号,降低信号误检率。 相似文献
15.
16.
为了克服传统端点检测算法在有噪环境下的不足,提出了一种新的语音多子带端点检测算法,它能根据子带背景噪声大小动态设置门限.实验结果表明,所提出的算法较传统的检测方法有更好的检测性能. 相似文献
17.
This paper presents a new approach to detect and classify background noise in speech sentences based on the negative selection algorithm and dual-tree complex wavelet transform. The energy of the complex wavelet coefficients across five wavelet scales are used as input features. Afterward, the proposed algorithm identifies whether the speech sentence is, or is not, corrupted by noise. In the affirmative case, the system returns the type of the background noise amongst the real noise types considered. Comparisons with classical supervised learning methods are carried out. Simulation results show that the artificial immune system proposed overcomes classical classifiers in accuracy and capacity of generalization. Future applications of this tool will help in the development of new speech enhancement or automatic speech recognition systems based on noise classification. 相似文献
18.
Pitch estimation is important in various speech research areas, but when the speech is noisy, accurate pitch estimation with conventional pitch detectors is almost impossible. To solve this problem, we propose a new pitch detection algorithm for noisy speech using a noise whitening technique on the background noise and obtain successful results. 相似文献
19.
Background noise is usually an important factor that affects speech recognition performance and many other applications. In this Letter background noises (especially background speech or music) can be significantly suppressed under this new dual algorithm that comprises a three-microphone active word boundary detector and a three-input adaptive noise canceller. An example of a real data experiment has been conducted and shows an SNR improved up to 17.1 dB. Although array signal processing and word boundary detection are not new, this particular combination has not been previously used and is of great practical significance 相似文献