首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
《计算机科学与探索》2019,(9):1534-1542
语音端点检测是语音信号处理的基础,为了提高在低信噪比及非平稳噪声下语音端点检测的准确性,提出了一种基于长时信号功率谱变化的语音特征,利用阈值判决法验证了这一特征在语音端点检测中的应用前景。该方法首先统计信号在长时段下功率谱的变化量;然后进行阈值判决,在初始化后可依据每次的判决结果自适应更新阈值;最后通过投票决策机制来判定当前是否为语音帧。仿真结果表明,与两种经典的基于长时特征(长时段信号变化率和长时段信号谱平坦度)的语音端点检测方法相比,所提方法在不同噪声环境及信噪比下,均具有更高的检测准确率,尤其在非平稳噪声条件下的检测效果提升明显,例如在机枪噪声环境下,平均检测准确率提高超过10%。  相似文献   

2.
针对复杂噪声环境下基于经验模态分解(EMD)的端点检测算法准确率低且不能自适应环境问题,提出了一种结合EMD和交叉熵的语音端点检测新算法。算法利用白噪声在各本征模态函数(IMF)中的概率分布是既定的且与幅值无关的EMD分解特性,将衡量语音帧与噪声帧概率分布差异性的交叉熵特征与EMD能量特征相结合,设置自更新检测阈值,实现复杂噪声环境下的语音端点检测。仿真实验证实了该方法在低信噪比以及非平稳噪声情况下具有显著的有效性和优越性。  相似文献   

3.
张敏  曾晓辉 《计算机工程》2012,38(19):170-174
为提高噪声环境中语音端点检测的准确率,提出一种基于信息熵的检测方法.将分帧语音信号按照不同阶数重新量化,选择其中波动范围大的信息熵作为该信号的优选信息熵,通过多次仿真实验确定较优门限,设计状态机对多段带噪语音进行端点检测.实验结果表明,该方法具有较好的抗噪声性能,在同等环境中的检测误判率较低.  相似文献   

4.
一种新的基于信息熵的带噪语音端点检测方法   总被引:5,自引:0,他引:5  
严剑峰  付宇卓 《计算机仿真》2005,22(11):117-120
在自动语音识别和变速率语音编码技术中,语音端点检测是前端处理的一个重要环节.而在实际的噪声环境下,一些传统的端点检测方法已不适用.该文提出了一种新的基于信息熵的语音端点检测方法,该方法通过对语音信号的短时功率谱进行谱分析,由此构造熵函数作为端点检测的特征参数.实验结果表明,该方法在噪声环境下性能优于传统的基于能量的端点检测方法.而且相对于基于频谱谱熵的算法,在低信噪比(SNR〈0dB)情况下,该文方法有更好的鲁棒性,可使平均检测精确度进一步提高约5%.  相似文献   

5.
《计算机工程》2019,(2):250-257
在低信噪比及非平稳的噪声环境下,传统基于特征的语音端点检测方法检测正确率低、稳定性差。为此,提出一种新的语音端点检测方法。通过对含噪语音进行谱减法降噪,提取谱减后的语音信号与前导无话帧的M FCC倒谱距离特征,计算均匀子带频带方差特征,并对阈值进行动态更新,利用双参数双门限法对带噪语音进行端点判定。实验结果表明,与基于DWT-MFCC倒谱距离、基于谱减法和均匀子带频带方差的端点检测方法相比,该方法具有较高的检测正确率及较低的漏检率与误检率。  相似文献   

6.
为了提高低信噪比环境下语音增强的效果、算法的鲁棒性.在基于维纳滤波算法的基础上,结合基于频域特征的语音端点检查算法,提出了一种新的语音增强算法.端点检测算法使用小波包ERB子带的谱熵和改进的频域能量的能熵比法.其中,小波包ERB子带的谱熵考虑了人耳听觉掩蔽模型和语音与噪声信号之间的频率分布之间的不同;频域能量利用了有语音帧和无语音帧的能量不同.维纳滤波算法实时采集语音数据并使用新的参数来区别无语音段和有语音段,并在无语音段平滑更新噪声谱.实验结果表明,该端点检测算法能够很好的区分有语音段和无语音段,这就使得在低信噪比的情况下语音增强效果得到了提升,同时算法的鲁棒性和实时性也得到了保障.在与其他两种算法对比中,得到了更好的语音增强效果.  相似文献   

7.
端点检测是语音信号处理的一个关键环节。为提高语音在低性噪比以及非平稳噪声环境下的端点检测性能,在长时信号变化特征(LTSV)的基础上提出一种新的D-LTSV语音端点检测方法。采用Bartlett-Welch方法估计语音谱,分析语音谱在长时域上的熵,利用倒谱的动态特性分析方法提取连续帧熵值的动态变化特征。实验结果表明,D-LTSV综合考虑了语音的非平稳性和帧间非平稳性的动态变化情况,具有比LTSV更好的分辨能力,特别是在低性噪比和非平稳噪声的环境下,D-LTSV的分辨能力提升了50.77%,能够准确地进行端点检测,具有更强的鲁棒性。  相似文献   

8.
一种噪声环境下的实时语音端点检测算法   总被引:12,自引:0,他引:12  
语音识别中的端点检测要求对噪声有很强的鲁棒性。该文提出一种方法,综合采用了语音信号中的4个相互之间独立性强的特征-短时能量、倒谱距离、能量谱方差和能量-熵特征,有效地改进传统的基于单一语音特征方法的缺陷,在动态变化的噪声环境中,大大提高了端点检测对噪声的鲁棒性;为了克服分类回归树(CART)决策法的过度复杂性,引入一种新的5状态自动机进行快速决策,以保证算法的实时性能,并且能够提高端点检测的可靠性。通过各种实际噪声环境的测试,实验表明这一算法可以显著提高在低信噪比、噪声动态变化的各种环境下的端点检测性能。  相似文献   

9.
一种基于自适应谱熵的端点检测改进方法   总被引:1,自引:0,他引:1  
在低信噪比的环境下,为增强与噪声的区分度,提出了一种适应于低信噪比环境的语音端点检测方法.通过改进语音端点检测的特征参数,更好地区分语音信号与噪声信号,提高在低信噪比环境下的端点检测正确率.基于子带谱熵,引入正值常量对基本谱熵参数进行算法改进,得到改良的负谱熵特征,并结合自适应子带选择方法,得到一种新颖的特征参数--自适应子带常量负谱熵.特征在低信噪比的情况下有较强的抗噪能力,并能够准确地检测出语音端点.实验结果表明,不仅快速有效,具有较强的鲁棒性,而且适合低信噪比的语音端点检测.  相似文献   

10.
为了提高车载噪声环境下语音端点检测的准确性,提出了一个基于GRU RNN的神经网络结构, 对带噪语音的Log Mel特征序列进行处理,实现语音与噪声的分离,从而恢复出纯净语音的Log Mel特征序列;在此基础上,提出一种新的特征Log Mel Sum,并用该特征进行端点检测。实验结果表明,在车载环境下,本文方法具有很好的端点检测性能。  相似文献   

11.
基于排列组合熵的语音端点检测技术研究   总被引:1,自引:1,他引:0  
语音端点检测对于后续语音识别分析有着重要的意义,论文研究基于排列组合熵的语音端点检测技术。分析排列数和窗长对检测性能的影响,对含不同噪声类型及不同信噪比的中英文语音样本进行了端点检测实验。尤其在低信噪比情形下,检测方法要优于谱熵特征检测方法。该方法具有较优的稳健性和实时性等特点,为强背景噪声下的语音端点检测提供了新的研究途径。  相似文献   

12.
噪声信号对于语音信号是相对奇异的.小波变换是分析信号奇异性的有利工具.在利用小波对含噪语音进行分析研究的基础上,提出了一种新的端点检测方法.该算法利用了基于信号奇异性的统计特征和高低频能量比特征.实验结果表明,在低信噪比的情况下,该算法依然能有效地进行语音分割.  相似文献   

13.
虚拟座舱飞行过程中碰撞检测的实现   总被引:2,自引:0,他引:2  
虚拟座舱中进行碰撞检测的常用方法为包围盒碰撞检测,但基于包围盒的碰撞检测精确性不高,本对包围盒碰撞检测算法进行了改进,提高了检测精度,在将该算法应用于虚拟座舱飞行过程中的碰撞检测时,根据具体情况进行了一定程度的简化,降低了系统开销。  相似文献   

14.
基于独立分量分析特征提取的带噪信号端点检测   总被引:2,自引:0,他引:2  
运用独立分量分析(ICA)提取信号高阶统计特征的方法,提出一种新的利用信号自身统计特性的信噪区分方法,由于ICA变换可以增大语音和噪声的统计性差别,故在ICA域内可以有效区分语音和噪声。在此基础上提出了ICA能量(ICAE)和滤波ICAE(FICAE)特征来进行端点检测。实验表明,结合FICAE与ICAE的端点检测方法在不同信噪比时具有一定的稳定性,在很低信噪比下也能有效检测出语音的端点,显示了良好的抗噪性能,为强背景噪声下弱信号的端点检测提供了新的途径。  相似文献   

15.
现有的数字语音取证研究主要集中于对单一的某种操作进行检测,无法对不相关的操作进行判断。针对该问题,提出了一种能够同时检测经过变调、低通滤波、高通滤波和加噪这四种操作的数字语音取证方法。首先,计算语音的归一化梅尔频率倒谱系数(MFCC)统计矩特征;然后通过多个二分类器对特征进行训练,并组合投票得到多分类器;最后使用该多分类器对待测语音进行分类。在TIMIT以及UME语音库上的实验结果表明,归一化MFCC统计矩特征在库内实验中均达到了97%以上的检测率,且在对MP3压缩鲁棒性测试的实验中,检测率仍能保持在96%以上。  相似文献   

16.
林帆  徐明星 《计算机科学》2006,33(4):164-167
本文探讨了基于时域的语音切分算法,在前人研究的基础上,提出一种改进算法——自适应、前后搜索和检测短时脉冲噪音算法。该算法主要利用语音信号的短时参数,采用统计的方法定出切分所需要的阈值,根据背景音和静音过零率的不同,进一步搜索符合要求的静音帧,同时滤去短时脉冲噪音。实验证明,该算法准确率很高,有很好的鲁棒性,允许误差在60ms的范围内,对于原始语音切分错误率为5.04%;在信噪比(SNR)大于等于2dB的情况下。对带噪语音的切分错误率为10%~20%。  相似文献   

17.
针对多数语音识别系统在噪音环境下性能急剧下降的问题,提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过组合语音信号和其差分信号的上升过零率获得频率信息,通过峰值检测和非线性幅度加权来获取强度信息,二者组合在一起,得到输出语音特征,再分别用BP神经网络和HMM进行训练和识别。仿真实现了不同信噪比下不依赖人的50词的语音识别,给出了识别的结果,证明了组合差分信息的过零与峰值幅度特征具有较强的抗噪声性能。  相似文献   

18.
Similar system response times have been reported for keyword and semantic context warning messages based on the premise that the linguistic redundancy of semantic context warnings require less attention than the shorter keyword warnings. The present study was conducted to learn whether an initial word of warning could be used for alerting purposes without increasing system response time and whether or not differences exist between the keyword and semantic conditions. Fifteen subjects were given a flying task using an IBM PC Flight Simulator package and responded to synthesised speech warnings under conditions of cockpit conversation, simulated noise and various flying duties. The keyword-only condition provided a statistically significant lower SRT than all other conditions but, with larger movement/reaction time, appeared to have placed the greatest cognitive demand on subjects. Recommendations are made on the implications regarding the use of the keyword-only format.  相似文献   

19.
何志勇  朱忠奎 《计算机应用》2011,31(12):3441-3445
语音增强的目标在于从含噪信号中提取纯净语音,纯净语音在某些环境下会被脉冲噪声所污染,但脉冲噪声的时域分布特征却给语音增强带来困难,使传统方法在脉冲噪声环境下难以取得满意效果。为在平稳脉冲噪声环境下进行语音增强,提出了一种新方法。该方法通过计算确定脉冲噪声样本的能量与含噪信号样本的能量之比最大的频段,利用该频段能量分布情况逐帧判别语音信号是否被脉冲噪声所污染。进一步地,该方法只在被脉冲噪声污染的帧应用卡尔曼滤波算法去噪,并改进了传统算法执行时的自回归(AR)模型参数估计过程。实验中,采用白色脉冲噪声以及有色脉冲噪声污染语音信号,并对低输入信噪比的信号进行语音增强,结果表明所提出的算法能显著地改善信噪比和抑制脉冲噪声。  相似文献   

20.
General Regression Neural Networks (GRNN) have been applied to phoneme identification and isolated word recognition in clean speech. In this paper, the authors extended this approach to Arabic spoken word recognition in adverse conditions. In fact, noise robustness is one of the most challenging problems in Automatic Speech Recognition (ASR) and most of the existing recognition methods, which have shown to be highly efficient under noise-free conditions, fail drastically in noisy environments. The proposed system was tested for Arabic digit recognition at different Signal-to-Noise Ratio (SNR) levels and under four noisy conditions: multispeakers babble background, car production hall (factory), military vehicle (leopard tank) and fighter jet cockpit (buccaneer) issued from NOISEX-92 database. The proposed scheme was successfully compared to the similar recognizers based on the Multilayer Perceptrons (MLP), the Elman Recurrent Neural Network (RNN) and the discrete Hidden Markov Model (HMM). The experimental results showed that the use of nonparametric regression with an appropriate smoothing factor (spread) improved the generalization power of the neural network and the global performance of the speech recognizer in noisy environments.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号