首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 55 毫秒
1.
在一个语音信号处理系统中,端点检测是对语音预处理阶段最重要的环节,好的检测效果可提高后续语音处理的效率。文章结合语音信号特性,采用根据人耳听觉机理Mel频率倒谱系数(Mel Frequency Coefficient,MFCC)对带噪语音进行端点检测,通过仿真实验的方式证明其可行性。  相似文献   

2.
将小波变换的多分辨率特性用于改进Mel频率倒谱系数MFCC的前端处理中,给出了一种新的语音特征参数——小波MFCC。其特点在于采用小波变换、分层FFT和频率合成代替原来MFCC中的FFT部分,使频谱分辨率提高了一倍。试验证明,小波MFCC特征参数在较大词汇量情况下,其识别率优于MFCC特征参数的结果。  相似文献   

3.
语音情感识别是人工智能的重要研究领域之一,特征参数提取的准确性直接影响识别的效果。分析了发音持续时间、平均振幅、基音频率,第一共振峰和Mel频率倒谱参数,并基于模糊熵理论提取了各参数的权重。再利用模糊熵进行有效的度量融合.最后通过改进后综合判决对情感语句做出识别判定。研究发现融合后的参数增强了情感识别的效果。  相似文献   

4.
基于神经网络的说话人识别方法可以在一定程度上模仿人脑的功能,是说话人识别中的一种主要技术,但它通常难以确定隐层单元的数目,收敛速度慢,易于收敛到极小点。该文研究了一种用于说话人识别的小波神经网络模型,给出了网络结构和学习算法。采用Mel频率倒谱系数作为与文本无关的说话人识别的特征参数,并利用该模型进行了5个人的说话人识别实验,得到99.5%的识别率。实验结果表明,小波网络和传统的BP网络相比,训练速度和识别率都有了较大提高,具有良好的应用前景和进一步研究的价值。  相似文献   

5.
随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点.语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性.文中则主要在加性白噪声环境下研究Mel倒谱参数、Mel差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进.从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声.  相似文献   

6.
将小波变换的多分辨率特性用于改进Mel频率倒谱系数MFCC的前端处理中,给出了一种新的语音特征参数——小波MFCC。其特点在于采用小波变换、分层FFT和频率合成代替原来MFCC中的FFT部分,使频谱分辨率提高了一倍。试验证明,小波MFcc特征参数在较大词汇量情况下,其识别率优于MFCC特征参数的结果。  相似文献   

7.
语音识别指利用计算机识别语音信号所表达的内容,其目的是要准确地理解语音所蕴含的含义。本文着重研究了语音识别实现过程的特征提取,针对特征提取的多种方法,选用LPC倒谱系数作为特征参数提取,较彻底地去除了语音信号产生过程的激励信息,主要反映了声道模型,而且只需十几个倒谱系数就较好地描述了语音的共振峰特性。通过对语音信号进行预加重、分帧、加窗、自相关分析,而后提取出LPC倒谱系数。根据流程编写VC程序,对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,从而获得用于语音识别的重要信息。  相似文献   

8.
人脸语音动画是虚拟现实领域的热点,语音特征参数提取是实现语音同步动画的前提和关键所在。为了能够提取鲁棒性更好的语音特征参数,在小波变换的理论基础上,借鉴MFCC特征参数的提取方法,运用表征语音动态特征的特征差分算法,提出了一种基于离散小波变换的语音特征参数(DWTMFCC)提取方法,并与反映语音情感特征的韵律参数相结合。通过基于LGB算法的VQ模型进行说话人语音识别,可以得到组合特征参数的识别率较高。  相似文献   

9.
语音转换是一项非常复杂的技术,语音特征参数的选取是语音转换能否成功的关键。本文基于语音信号个性特征,主要针对超音段特征和音段特征的特征参数基频、Mel倒谱系数和共振峰通过理论和实验对它们各自的性能进行分析研究。  相似文献   

10.
基于离散小波变换和感知频域滤波的语音特征参数   总被引:14,自引:0,他引:14  
为了提高语音识别系统对环境噪声的鲁棒性,本文通过对几种特征参数的噪声鲁棒性的研究,在感知倒谱分析的基础上,引入了多分辨率小波分析技术,利用小波变换的时频局域性并结合感知频域上的滤波技术,提出了一种新型的语音特征参数,该特征参数对于环境噪声具有很强的耐噪性。  相似文献   

11.
将小波变换的多分辨率特性用于改进Mel频率倒谱系数MFCC的前端处理中,给出了一种新的语音特征参数——小波MFCC。其特点在于采用小波变换、分层FFT和频率合成代替原来MFCC中的FFT部分,使频谱分辨率提高了一倍。试验证明,小波MFCC特征参数在噪声环境和较大词汇量情况下,其抗噪性和识别率均优于MFCC特征参数的结果。  相似文献   

12.
基于环境特征判别学习的顽健语音识别方法   总被引:3,自引:0,他引:3       下载免费PDF全文
韩纪庆  高文 《电子学报》2001,29(2):196-198
提出一种基于环境特征判别学习的顽健语音识别方法 ,它首先通过使用一个简单的分类器和梯度下降法迭代地学得环境特征 ,接着利用得到的环境特征从观测到的混噪语音特征中估计出纯净的语音特征 ,然后将估计出来的纯净语音特征用到后端的HMM分类器中 .使用所提出的方法对不特定话者小词表进行实验 ,其系统误识率与基本HMM系统相比下降了 33 3% .  相似文献   

13.
肖方  施玉霞  李刚 《电声技术》2010,34(10):54-56,61
介绍了一款非特定人嵌入式语音控制系统。硬件平台采用mini2440开发板,其CPU处理器是三星公司的S3C2440:针对嵌入式系统存储空间有限和实时性要求高的特点.在特征提取后加入LBG算法以减少系统的存储量和计算量;识别阶段采用DHMM算法,计算量少,适应性强。将该系统用于语音对机械手臂的控制试验,结果表明本系统的识别率达到了98%以上,运算速度快,计算复杂度小,能满足一般应用对语音控制的需求,在市场上具有广泛的应用前景。  相似文献   

14.
吴佳龙  李坤  刘中 《电子科技》2015,28(2):22-25,29
语音识别在非接触式控制系统中的应用普遍,基于数字化平台的孤立词语音识别技术是一项重要的研究方向。文中介绍了短时能零差断点检测算法,采用MEL频率倒谱系数特征参数提取算法和动态时间规整的模型匹配方法,并用Matlab进行仿真,仿真结果表明,系统具有较强的实时性和较高的识别率。  相似文献   

15.
基于小波包变换和MFCC的说话人识别特征参数   总被引:1,自引:0,他引:1  
陈静  张飞云 《电声技术》2009,33(2):49-51
研究了小波包变换及MFCC参数的提取,结合二者特点,提取了基于小波包变换和MFCC的新参数DWT-MFCC.并在基于16阶GMM系统上进行说话人识别实验。实验结果表明,相对于传统的MFCC参数,在相同的噪声环境下,DWT—MFCC参数具有更高的说话人识别率。  相似文献   

16.
刘菁华 《电声技术》2011,35(9):47-48,54
提出了一种适用于低信噪比下的语音识别算法.该算法在前端利用人耳听觉掩蔽效应进行语音增强,然后提取一种在不需要噪声先验知识,能避免大量计算的情况下能较好地消除系统加性噪声的自相关MFCC(RAS-MFCC)参数,作为语音特征参数进行识别.  相似文献   

17.
高谦  张国杰  张树才 《通信技术》2008,41(6):153-154
为了实现高速语音特征参数的提取,在分析了美尔频率倒谱特征参数提取算法的基础上,提出了算法的硬件设计方案,介绍了各模块的设计原理.该方案增加了语音激活检测功能,可对语音信号中的噪音帧进行检测,提高了特征参数的可靠性.最后将设计实现于Stratix Ⅱ系列FPGA上,仿真结果表明设计可以实现高速,高精度的MFCC特征参数提取.  相似文献   

18.
周慧  魏霖静 《电子设计工程》2012,20(16):188-190
提出了一种基于LS-SVM的情感语音识别方法。即先提取实验中语音信号的基频,能量,语速等参数为情感特征,然后采用LS-SVM方法对相应的情感语音信号建立模型,进行识别。实验结果表明,利用LS-SVM进行基本情感识别时,识别率较高。  相似文献   

19.
In this paper, a feature extraction (FE) method is proposed that is comparable to the traditional FE methods used in automatic speech recognition systems. Unlike the conventional spectral‐based FE methods, the proposed method evaluates the similarities between an embedded speech signal and a set of predefined speech attractor models in the reconstructed phase space (RPS) domain. In the first step, a set of Gaussian mixture models is trained to represent the speech attractors in the RPS. Next, for a new input speech frame, a posterior‐probability‐based feature vector is evaluated, which represents the similarity between the embedded frame and the learned speech attractors. We conduct experiments for a speech recognition task utilizing a toolkit based on hidden Markov models, over FARSDAT, a well‐known Persian speech corpus. Through the proposed FE method, we gain 3.11% absolute phoneme error rate improvement in comparison to the baseline system, which exploits the mel‐frequency cepstral coefficient FE method.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号