首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 187 毫秒
1.
基于时频增强和谱熵的语音端点检测技术   总被引:2,自引:0,他引:2  
该文提出了基于时频增强和谱熵的语音端点检测算法。该算法对带噪语音在频域利用谱减法去除宽带加性噪声,在时域去除由谱减带来的残差噪声从而对语音进行了增强。对增强后的语音利用谱熵特征进行端点检测。实验结果表明,该算法快速有效,具有较强的抗噪能力,特别适合低信噪比的语音端点检测。  相似文献   

2.
基于谱熵的语音端点检测算法改进研究   总被引:1,自引:0,他引:1  
语音端点检测是语音处理中重要的领域之一。常规谱熵语音端点检测算法是通过检测语音的功率谱的平坦程度,从而达到语音端点检测的目的。但是该方法在平稳噪声环境下较好,在无噪声和非平稳噪声环境下效果较差。作者在分析了无噪声环境下常规谱熵端点检测算法效果差的原因的基础上,结合了语音的短时能量算法,对常规谱熵算法进行了改进,形成了一个新的特征参数——谱熵能量积。仿真结果显示,该方法相对于常规谱熵算法,在无噪声的环境下检测精度有了很大的提高,在非平稳噪声环境下也有了一定的提高,鲁棒性得到增强。  相似文献   

3.
智能语音已经走进人们的日常生活,端点检测技术的发展对语音识别的应用起到了关键性作用,如何在嘈杂环境下正确识别出语音段,是影响语音识别系统性能的重要因素。针对已有的端点检测技术,提出了改进型多特征语音端点检测方法,在降噪的同时进行语音增强。即运用子带谱熵进行噪声估计,运用自适应噪声平滑进行降噪,并在谱减法的基础上进一步改进谱减参数,得到增强的语音信号。通过MATLAB仿真发现,改进型多特征语音端点检测技术能够更好地适应不同噪声环境,对端点检测有很好的适用性。  相似文献   

4.
为了克服传统语音端点检测算法在低信噪比环境下准确率低的问题,提出一种基于谱熵梅尔积(MFPH)的语音端点检测算法.首先,提取带噪语音信号的梅尔频率倒谱系数中的第一维参数MFCC0,将其与谱熵的乘积作为最终区分语音段和背景噪声段的融合特征参数;然后,结合模糊C均值聚类算法和贝叶斯信息准则(BIC)算法对MFPH特征参数门限值进行自适应估计;最后,采用双门限法进行语音端点检测.实验结果证明,与传统方法比较,该方法在-5~15 dB低信噪比环境下的语音端点检测准确率有较大提高.  相似文献   

5.
基于分带谱熵和小波域Teager能量提出了一种改进的语音清浊分类算法.该算法首先计算频域内的分带谱熵,然后在小波域计算不同频带的Teager能量,计算出低频能量所占的比例,通过这2个参数进行清浊判断.实验结果证明,由于分带谱熵能加深清浊音之间的差异,Teager能量能快速跟踪声门周期内信号能量的变化,因此该算法更容易提取浊音,在纯净语音和含噪语音上的性能都优于幅度能量算法.  相似文献   

6.
针对传统方法在低信噪比条件下的检测结果无法较好地满足需要,提出了将语音信号小波包BARK子带方差和谱熵二者相结合的新端点检测方法.首先对带噪语音采用多窗谱估计谱减法降噪,然后利用小波包分解构成BARK子带,求出每帧信号的BARK子带方差均值和谱熵值,最后用方差值除以谱熵值,将二者的比值作为双门限检测法的参数进行端点检测...  相似文献   

7.
为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。  相似文献   

8.
语音增强是影响语音识别系统性能的重要成分.为了比较语音增强算法的性能,采用Matlab软件进行了数值仿真,对不同噪声环境下的语音用3种不同的方法进行降噪,采用信噪比、端点检测等方法来衡量降噪效果,并对几种增强算法的性能进行了比较分析.结果表明,在变噪声环境下短时谱MMSE法最佳,谱减法和维纳滤波法各有优点.  相似文献   

9.
语音识别技术早已不再局限于实验室中,但部分关键技术仍需进一步优化与改进,以适应社会和用户不断增加的需求.从语音识别的技术理论入手,着重研究端点检测技术,拟在此基础上针对现有算法进行改进,提升其在低信噪比环境下的识别准确率.提出了一种在对语音进行LMS自适应降噪后,采用倒谱距离熵比的新型端点检测算法,并在MATLAB平台...  相似文献   

10.
为了提高语音端点检测的准确性,增强端点检测算法在噪声环境下的鲁棒性,提出两种新的端点检测参数。其中,基于临界频带的谱熵参数综合考虑了人耳对语音的感知特性以及语音信号和噪声信号的频域分布差异,差值频域能量参数考虑了语音帧和无声帧在频域上的能量差异。结合两种参数的优点,构成一种鲁棒的端点检测参数,同时,为了避免因阀值判决的单一性而产生误判,在端点检测过程中加入了基于特征分布统计的过渡段判决。试验结果表明,本研究提出的语音端点检测算法对语音帧和无声帧具有较好的区分性,在不同噪声且信噪比较低情况下,端点检测准确率相比传统抗噪端点检测算法均有所提升,特别是在非平稳噪声下,准确率提升超过5%。  相似文献   

11.
为了提高混噪语音的识别率,对以往功率谱相减法进行了数理解析,指出了其不足之处。针对某些混有频率成份较少的噪音的语音,提出了一种新的功率谱相减法,给出了相应的处理算法,并运用这种新的功率谱相减法进行了仿真语音识别实验,实验结果证明了这种新的功率谱相减法的正确性和有效性。  相似文献   

12.
用于语音端点检测的鲁棒性特征提取新方法   总被引:1,自引:0,他引:1  
针对实际噪声环境中的语音端点检测问题,提出了一种适用于不同噪声类型的鲁棒性特征提取方法。该方法把基音检测中的循环平均幅度差函数应用到端点检测的特征提取中,并与基本的谱熵相结合,具有适用范围广和不需要噪声先验知识的优点。仿真实验验证结果表明:该特征对于多种类型的噪声有明显的抑制作用,并且在低信噪比时仍然有效。  相似文献   

13.
基于小波变换的静音与语音分割新算法   总被引:6,自引:1,他引:6  
含噪语音信号的静音与语音分割,即端点检测问题是语音识别至关重要 的一步,为了提高语音分割对环境的适应性,提出了一种利用小波变换分割含噪语音信号中静音与语音的新算法,该算法首先将语音信号进行小波变换,利用小波系数去噪,然后选择小波部分子带跟踪信号的能量变化以分割语音与静音,仿真实验表明该算法在低信噪比条件下也能够有效分割语音。  相似文献   

14.
语音信号的端点检测是语音识别过程中的重要环节,端点检测结果精确与否直接关系着语音识别的准确度。使用车载语音作为测试数据,利用传统双门限法进行端点检测,发现传统双门限方法在静音条件下和带噪条件下获得语音端点检测信息存在较大误差。针对上述问题,提出了一种改进的双门限法进行语音端点检测,针对语音信号以及短时平均能量和过零率进行处理,并通过Matlab进行仿真,实验结果说明提出的改进方法与传统方法相比,在静音和带噪条件下,都更接近测试数据中真正的语音端点。  相似文献   

15.
This paper focuses on acoustic features that effectively improve the recognition of emotion in human speech. The novel features in this paper are based on spectral-based entropy parameters such as fast Fourier transform (FFT) spectral entropy, delta FFT spectral entropy, Mel-frequency filter bank (MFB) spectral entropy, and Delta MFB spectral entropy. Spectral-based entropy features are simple. They reflect frequency characteristic and changing characteristic in frequency of speech. We implement an emotion rejection module using the probability distribution of recognized-scores and rejected-scores. This reduces the false recognition rate to improve overall performance. Recognized-scores and rejected-scores refer to probabilities of recognized and rejected emotion recognition results, respectively. These scores are first obtained from a pattern recognition procedure. The pattern recognition phase uses the Gaussian mixture model (GMM). We classify the four emotional states as anger, sadness, happiness and neutrality. The proposed method is evaluated using 45 sentences in each emotion for 30 subjects, 15 males and 15 females. Experimental results show that the proposed method is superior to the existing emotion recognition methods based on GMM using energy, Zero Crossing Rate (ZCR), linear prediction coefficient (LPC), and pitch parameters. We demonstrate the effectiveness of the proposed approach. One of the proposed features, combined MFB and delta MFB spectral entropy improves performance approximately 10% compared to the existing feature parameters for speech emotion recognition methods. We demonstrate a 4% performance improvement in the applied emotion rejection with low confidence score. Supported by MIC, Korea under ITRC IITA-2009-(C1090-0902-0046) and the Korea Science and Engineering Foundation (KOSEF) funded by the Korea government (MEST) (Grant No. 20090058909)  相似文献   

16.
语音端点检测方法的分析与实现   总被引:1,自引:0,他引:1  
本文在研究短时能量和短时过零率两种语音端点检测基本算法的基础上,编程实现了双门限的端点检测;并进一步根据小波变换的原理,利用小波变换和信号频域统计特性来精确地进行端点检测;最后,在研究了倒谱的相关理论基础上,实现了将语音数据进行倒谱变换,通过计算倒谱距离,在具有一定背景噪声环境下进行端点检测的实验.  相似文献   

17.
强噪声背景下汉语语音端点检测和音节分割   总被引:3,自引:0,他引:3  
根据汉语语音的特点,提出了强噪声背景下对汉语语音进行了端点检测和音节分割的新算法,在85dB的噪声环境中,实验考察了端点检测的正确性和音节分割的稳定性,结果表明,算法在这两方面达到了很高的性能,且与发音者无关。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号