共查询到19条相似文献,搜索用时 125 毫秒
1.
2.
在语音识别系统中产生错误识别的原因之一是端点检测有误差.在高信噪比情况下,正确地确定语音的端点并不困难.然而,大多数实际的语音识别系统需工作在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法在噪声环境下不能有效地工作.本文利用倒谱特征来检测语音端点,提出了带噪语音端点检测的两个算法,第一个算法利用倒谱距离代替短时能量作为判决的门限,第二个算法改进了基于隐马尔柯夫模型(HMM)的语音检测以适应噪声的变化,实验结果表明本方法可得到高正确率的带噪语音端点检测. 相似文献
3.
基于LPC美尔倒谱特征的带噪语音端点检测 总被引:2,自引:0,他引:2
复杂的噪声环境是语音识别系统在实际应用中性能下降的原因之一,识别预处理中的带噪端点检测作为关键技术,其性能的优劣某种程度上决定了识别率的高低。笔者提出了基于LPC美尔倒谱特征的带噪端点检测方法,对语音信号分高低频段分别提取IPC美尔倒谱特征分析,根据Mel倒谱距离判决,采用自适应噪声估计,实验结果表明,该方法计算效率较高,低信噪比下有较好的检测性能。 相似文献
4.
5.
6.
针对短时TEO能量算法抗噪性差的缺点,提出了一种强噪声下的端点检测新算法.该算法在短时TEO能量端点检测的基础上,增加Mel倒谱距离判断环节,采用先粗判后精判的互补性两级判决机制.首先利用强抗噪性Mel倒谱距离进行端点粗判,然后再利用体现语音信号时域特征与语音共振峰特性的短时TEO能量进行端点精判.实验表明,在信噪比相对较低的环境下,该改进算法与传统的双门限法和短时TEO能量相比,在没有增加运算复杂度的同时提高了检测系统的准确度. 相似文献
7.
8.
9.
基于压缩感知观测序列倒谱距离的语音端点检测算法 总被引:2,自引:0,他引:2
本文基于语音信号在离散余弦基上的近似稀疏性,采用稀疏随机观测矩阵和线性规划重构算法对语音信号进行压缩感知与重构。研究了语音信号的压缩感知观测序列特性,根据语音帧和非语音帧压缩感知观测序列频谱幅度分布分散且差异较大的特性,提出基于压缩感知观测序列倒谱距离的语音端点检测算法,并对4dB-20dB下的带噪语音进行端点检测仿真实验。仿真结果显示,基于压缩感知观测序列倒谱距离的语音端点检测算法与奈奎斯特采样下语音的倒谱距离端点检测算法一样具有良好的抗噪性能,但由于采用压缩采样,减少了端点检测算法的运算数据量。 相似文献
10.
11.
MFCC是语音识别中常用的特征参数,根据MFCC分量对语音端点的敏感性,提出利用平常舍去的识别特征参数分量MFCC0作为语音端点检测的参量.接着根据MFCC0的特性设计了一种新的端点检测方法,该方法简单且无需增加额外的计算量.实验结果表明,基于该方法的语音识别系统不仅可以通过端点检测大大压缩数据量,而且提高了系统的识别率. 相似文献
12.
传统语音端点检测方法利用语音和噪声在某单一参数特征上的差异进行信号中语音起止点的切分,但不同参数在低信噪比不同噪声环境下表现不稳定,鲁棒性差。因此,本文提出了基于均匀子带谱方差,能熵比,梅尔倒谱距离,似然比四种参数相融合的语音端点检测方法。该方法能自适应地改变各参数阈值,并通过实时监测噪声段能熵比的值确定所采用的投票判决机制,从而进行语音端点判定。实验结果表明,该方法在低信噪比下较常用的端点检测方法有更高的检测正确率及鲁棒性,对语音信号后续处理工作有一定的借鉴意义。 相似文献
13.
14.
在基于智能卡的说话人确认系统中,实现了一种新的端点检测方法:能频值端点检测方法,其取得了较好的效果;在鲁棒性方面,研究了Mel倒谱系数各分量在说话人识别中的贡献,以及在参数级上Mel倒谱系数的差分系数及倒谱均值相减法对说话人识别的贡献;最后,讨论了基于智能卡的生物特征识别技术的应用途径。 相似文献
15.
耳语音识别可应用于国家安全的某些特殊需要。运用双门限法对语音样本进行端点检测,通过实验分别找出短时能量、短时过零率的高低门限4个参数的最佳取值。深入分析研究参数的抗噪问题,在MFCC参数中引入短时能量、一阶差分、二阶差分等参数,增强MFCC的抗噪性。研究表明,在隐马尔可夫模型中,MFCC和LPCC联合运用讨论识别效果要远优于独立参数。 相似文献
16.
基于语音静音段特征的手机来源识别方法 总被引:1,自引:0,他引:1
手机来源识别已成为多媒体取证领域重要的热点问题.提出了一种基于语音静音段特征的手机来源识别方法,该方法先通过使用自适应端点检测算法得到语音的静音段;然后将静音段的梅尔频谱系数(MFC)的均值作为分类特征;最后结合WEKA平台的CfsSubsetEval评价函数按照最佳优先(BestFirst)搜索进行特征选择,并采用支持向量机(SVM)对手机来源进行识别.实验部分对23款主流型号的手机进行了分类,结果表明所提特征具有较好的分类性能,在TIMIT数据库和自建的CKC-SD数据库上,平均识别准确率分别为99.23%和99.00%.另外,与语音段MFC特征和梅尔倒谱系数(MFCC)特征进行了对比,实验结果证明所提特征具有更加优越的性能. 相似文献
17.
为了提高语音信号端点检测的准确率,提出了改进的端点检测方法。该方法在传统基于能量和过零率的端点检测方法基础上,加入第三道门限——近似熵,对信号进行三级门限检测。仿真实验表明,该方法比传统方法更有效、更优越.能够比较准确的检测语音信号。 相似文献
18.
Endpoint detection is one of the most important steps in speech recognition. In a high SNR environment, the algorithm based on short-time energy and zero rate could be used. But when the SNR is low, this method may not be accurate. Some researchers proposed an algorithm which is based on MFCC Euclidean distance. It has a better performance in a noise environment. But that algorithm needs two thresholds to find the start and end point. However, when the values of two thresholds are not suitable, the detected result could be extremely bad. In this paper, we proposed an improved algorithm which is based on MFCC cosine value. This method can reduce errors, since it only needs one single threshold. The benefit of this improved algorithm is that the result can surely contain the real voice component. According to the experiment data, this improved algorithm can improve the speech recognition rate by 10% even in noise environment (SNR = 0). Thus, it proved that this improved methods has better robustness. 相似文献