共查询到20条相似文献,搜索用时 109 毫秒
1.
2.
基于子带能量累积变化的语音端点检测 总被引:1,自引:0,他引:1
噪声环境下的语音端点检测在稳健语音识别中占有十分重要的地位。根据噪音和语音子带能量的累积分布变化,提出一种新的语音信号端点检测算法。通过计算各帧的子带能量变化程度,并以此设定门限进行语音端点的检测。实验表明,与一些传统的端点检测算法比较,该算法在速度和抗噪声能力上都有所增强,适合低信噪比下的语音端点检测。 相似文献
3.
在语音识别系统中产生错误识别的原因之一是端点检测有误差.在高信噪比情况下,正确地确定语音的端点并不困难.然而,大多数实际的语音识别系统需工作在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法在噪声环境下不能有效地工作.本文利用倒谱特征来检测语音端点,提出了带噪语音端点检测的两个算法,第一个算法利用倒谱距离代替短时能量作为判决的门限,第二个算法改进了基于隐马尔柯夫模型(HMM)的语音检测以适应噪声的变化,实验结果表明本方法可得到高正确率的带噪语音端点检测. 相似文献
4.
为了提高低信噪比下语音端点检测的准确性,提出一种基于经验模态分解与功率谱熵的语音端点检测方法。对带噪语音信号进行经验模态分解获得一系列语音本征模函数,选取功率谱熵作为语音端点检测的特征,并计算特定阶本征模函数的功率谱熵实现语音的端点检测。通过EMD分解可以有效地消除白噪声的影响,仿真结果表明,在低噪比情况下结合经验模态分解和功率谱熵的方法能够有效实现语音端点检测。 相似文献
5.
【】语音端点检测是目前语音信号相关处理前端一个重要的环节,良好的检测效果可大大提高后续语音处理的效率。本文以模拟装甲车内部环境噪声对带噪语音进行端点检测,旨在通过设计良好的端点检测算法来提高后续语音增强的效果。从实战角度出发,语音端点检测的需求为较高的准确性和实时性以及鲁棒性。本文结合语音信号特性,采取以谱减法作为预处理的基础上通过能熵比对带噪语音进行端点检测,通过实验仿真的方式证明其可行性。 相似文献
6.
7.
基于双门限两级判决的语音端点检测方法 总被引:1,自引:0,他引:1
端点检测是语音信号处理过程中的重要步骤,其准确性直接影响语音信号处理的速度和结果。因此对于端点检测方法,特别是在噪声环境下的端点检测研究,一直是语音信号处理中的热点。文中针对声纹识别系统所作的端点检测前端处理,对比了利用短时能量和短时平均过零率进行端点检测的方法,运用Matlab实现了双门限法端点检测的编程和仿真。仿真结果表明,端点检测准确时识别率为93%。 相似文献
8.
9.
10.
11.
In this letter, we propose an unsupervised framework for speech noise reduction based on the recent development of low‐rank and sparse matrix decomposition. The proposed framework directly separates the speech signal from noisy speech by decomposing the noisy speech spectrogram into three submatrices: the noise structure matrix, the clean speech structure matrix, and the residual noise matrix. Evaluations on the Noisex‐92 dataset show that the proposed method achieves a signal‐to‐distortion ratio approximately 2.48 dB and 3.23 dB higher than that of the robust principal component analysis method and the non‐negative matrix factorization method, respectively, when the input SNR is ?5 dB. 相似文献
12.
In this paper, a smoothing approach for enhancing speech signals degraded by statistically independent additive nonstationary noise is developed. The autoregressive hidden Markov model (ARHMM) is used for modeling the statistical characteristics of both the clean speech signal and the nonstationary noise process. In this case, the speech enhancement comprises a weighted sum of the conditional mean estimators for the composite states of the models for the speech and noise, where the weights are equal to the posterior probabilities of the composite states, given the noisy speech. The conditional mean estimators use a smoothing approach based on two Kalman filters with Markovian switching coefficients, where one of the filters propagates in the forward-time direction and the other propagates in the backward-time direction with one frame. The proposed method is tested on speech signals degraded by Gaussian colored noise or nonstationary noise at various input signal-to-noise ratios. An approximate improvement of 4.7–5.2 dB in SNR is achieved at input SNR 10 and 15 dB. Also, in comparison with conventional method (Ephraim, IEEE Trans. Signal Process. SP-41 (April 1992) 725–735), our proposed method shows improvement of about 0.3 dB in SNR. 相似文献
13.
频域盲语音信号分离存在着排序模糊问题,提出一种基于相邻频点幅度相关和DOA估计相结合的解排序模糊方法,并且通过对一系列预处理(白化)、独立分量分析和后处理算法的优化和有机组合,很好地实现了卷积混合语音信号的盲分离。用真实录制的语音信号进行了仿真实验,恢复出来的源信号的信干比较分离之前提高了约13dB,证明了算法的有效性。 相似文献
14.
15.
16.
Hwai-Tsu Hu 《Electronics letters》1995,31(25):2145-2147
A robust method to extract the epochal information of voiced speech in a noisy condition is proposed. Its excellent performance is demonstrated by testing a synthetic vowel /a/ and a natural vowel /u/, both contaminated by white Gaussian noise with SNR=10 dB. Compared with three other methods, the proposed method produces the most evident peaks at the glottal closure instants 相似文献
17.
改进的后滤波波束形成器语音增强算法 总被引:1,自引:0,他引:1
该文提出了一种具有后滤波的波束形成器的语音增强改进算法。该算法主要解决维纳滤波器的理想信号功率谱估计,结合自功率谱减法和互功率谱减法计算出尽可能多的功率谱估计值,以使平均结果更接近于真实值,同时修正了声源移动引起的互功率谱变化。实验结果信噪比提高5dB以上,汽车环境中基于隐含马尔可夫模型(HMM)的小词汇量短语识别达到84%。从信噪比、平均谱距离和语音识别率可以看出该算法有效去除了原始算法中易残留的低频噪声,减少了语音信号失真。 相似文献
18.
为了降低激光多普勒测振仪在测声过程中给语音信号中引入的噪声,采用深度循环神经网络语音信号去噪的方法,对从激光多普勒测声系统采集回来的语音信号做降噪处理,并进行了理论分析和实验验证。结果表明,利用层数为1层~3层、每层神经元个数为1024的深度循环神经网络,对-6dB~6dB信噪比的语音信号进行处理,随着层数的增加,语音信号的质量在多项评价指标上达到8dB~12dB的提升; 深度循环神经网络可以有效对激光多普勒测声系统采集的语音信号进行降噪处理。该研究对提升语音信号的质量有着实际意义。 相似文献
19.
为能准确有效地判断出连续语音中各个音节的起止点,提出了一种改进的分形维计算方法,该算法将插值分形维的步长因子进一步精确到采样频率的数量级上,先求出语音分形维的最小二乘能量轨迹,再差分求其动态特征;在此基础上,设计了连续语音的两级搜索实时分割算法,并进行了基于DSP的硬件系统实验。结果证明,该算法较好地实现了语音段的实时分割和汉语音节切分,鲁棒性好,使得系统在信噪比为0 dB时音节分割准确率仍可保持在一个较高的水平上。最后开发了一个在线汉语语音标注器,借此阐述了论文工作在语音识别方面的应用。 相似文献
20.
基于扩展谱相减的RCAF基音周期检测算法 总被引:1,自引:0,他引:1
针对传统基音检测算法在信噪比低的情况下提取的基音周期错误率较高,该文提出了一种基于RCAF (Reverse CAMDF Autocorrelation Function)搜索试探平滑的基音轨迹提取方法。采用自适应判决准则的扩展谱相减进行语音增强,在语音段实现了对噪声信号的估计。应用RCAF算法提取基音周期,通过搜索试探平滑算法对提取出的基音周期进行平滑处理。该算法降低了误判率,提高了提取精度。仿真结果表明,该算法在-10dB信噪比情况下,其性能优于传统的CAMDF和AWAC等方法。 相似文献