首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
语音作为传递信息的一种常用手段,在人们的日常生活中有着非常重要的地位。随着科学的发展,语音识别愈来愈受到人们的重视。本文提出一种基于流形学习的特征提取方法———邻域保持嵌入( NPE)算法用于语音识别领域。流形学习是近几十年发展起来的降维方法,在图像识别领域已有应用,但在语音识别领域的应用非常之少。实验结果表明该算法可取得较好的识别率,同时所提取的特征稳定,计算速度快。  相似文献   

2.
季伟  王力 《通信技术》2013,(12):15-18
语音识别系统中,语音的特征提取是语音识别的关键技术之一。通过对语音的系统研究,提出一种全新的基于流形学习的特征提取方法。流形算法是近些年才发展起来的非线性降维方法,在人脸识别领域已取得较好效果,但在语音识别领域一直处于空白。现提出的基于流形学习LPP算法的语音特征提取方案,是一次重大的尝试,可以为以后深入研究语音识别技术提供较好参考。仿真实验结果表明,该算法与传统特征提取LPCC、MFCC算法相比,可以取得较好的识别率。  相似文献   

3.
训练环境和测试环境的不匹配是造成实际情况下语音识别性能下降的主要原因。在深入研究语音识别的噪声环境和Mel域倒谱系数(MFCC)流程的基础上,基于累计分布函数匹配思想,给出了3种通过减小训练环境和测试环境的不匹配度来提高系统在不同环境下适应性的鲁棒性特征提取方法,分析了它们的理论基础、基本算法,并在Aurora2.0数据库上进行了实现,验证了方法的有效性,为实际应用中如何选择语音识别系统提供了参考。  相似文献   

4.
基于改进语音特征提取方法的语音识别   总被引:1,自引:1,他引:0  
在分析语音特征提取方法基础上提出一种改进组合算法,并采用HMM声学模型和Viterbi算法进行模式训练和识别.实验结果表明,该算法在噪声环境中具有较好的鲁棒性,能有效提高噪声环境下中文连续语音识别的正确率,增强语音识别整体性能,因此在噪声环境下的语音识别系统中具有一定的实用价值.  相似文献   

5.
通过对特征提取模块2个重要部分:端点检测和线性预测倒谱(LPCC)相关原理的介绍分析,阐述了一种以线性预测倒谱(LPCC)为基础,进行特征提取的孤立词语音识别的具体实现方法,并对该方法所描述的系统进行了软件建模。通过分析研究,给出了提高识别率的具体改进方案。最后使用Matlab软件对相关方法及结论进行了验证,表明该方法确实在传统方法的基础上提高了识别率,且速度较快,具有实用性和良好的硬件可移植性,并讨论了它在一些关键环节的未来实现及改进方向。  相似文献   

6.
徐洁  杨鼎才 《无线电工程》2005,35(12):50-52
线性判别分析在语音的特征提取中有着广泛的应用,并取得了较好的效果,但是传统的 线性判别分析是基于所有类具有相同的协方差矩阵的这一假设,在实际系统中这一假设并不一定能满 足,且在多类状况下 LDA 不总是最优。在对类内散度矩阵和类间散度矩阵分别进行加重的基础上,提 出的加重线性判别分析有效地解决了以上2个问题。实验结果表明,利用该方法提取语音特征,大大提 高了语音识别系统的识别率。  相似文献   

7.
提出一种基于自组织神经网络的数字语音识别模型。首先用基于小波变换和线性预测的特征提取方法提取语音信号特征,用自组织神经网络进行识别判决。这种语音识别方法适合于小词汇量的孤立词识别,网络结构简单,所需训练数据十分的少,实时性能好。用MATLAB进行仿真实验,识别率达到98%。  相似文献   

8.
语音识别是语音信号处理的一个重要研究方向,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,广泛应用于控制、通信、消费品等行业。文中介绍了一种简单的语音识别算法。该算法主要流程包括预处理、端点检测、提取特征值、模式匹配4个过程,其中端点检测以幅值为标准,特征值采用临界带特征矢量,模板匹配采用DTW算法。主...  相似文献   

9.
阎福智 《中国新通信》2013,(21):127-128
语音特征提取的常用方法有LPCC、MFCC、PLP等,这些方法都是基于语音信号短时平稳的特性。利用二次特征提取可以通过对原始特征实施加权、微分、组合、筛选进一步提高识别率。本文介绍了语音识别和说话人识别中特征提取的常用方法以及最新发展,最后介绍了Hilbert- Huang这一新兴理论成果以及在特征提取中的应用。  相似文献   

10.
语音识别中的语音信号特征提取及分析   总被引:2,自引:0,他引:2  
语音信号特征的提取是语音信号处理(语音识别、语音合成、语音压缩)的基础,而线性预测分析(LPC)又是目前较为流行的一种分析方法,所以本文就如何利用LPC的分析方法来提取一组简洁而准确的语音特征参数的问题进行了研究,同时还详细地论述了语音特征提取的全过程,对各种谱估计进行了一定的分析  相似文献   

11.
目前,关于语音识别的研究尚处在实验室环境中,而实际的语音总是与噪声和干扰并存。人类能够在信噪比很低甚至在有干扰声音存在的环境中正确识剐语音主要是依靠人的双耳输入作用,本文就模仿人耳的听觉掩蔽效应来掩蔽噪声信号,提出了一种MFCC(Mel频率倒谱系数)改进提取算法。该算法能更好地减少噪声信号对纯净语音信号的影响,从而提高语音信号的识别率。实验表明改进后的算法相对于传统的MFCC提取算法大约有4.43%~8.42%的相对性能提升。  相似文献   

12.
汉语语音正弦模型特征分析和听觉辨识   总被引:1,自引:0,他引:1  
张毅楠  肖熙 《电声技术》2011,35(8):38-41
为了研究汉语语音的声学特征,将语音信号的正弦模型应用于语音的特征提取和分析,通过对语音的模型参数应用峰值匹配算法,得到了基于正弦模型的语谱图.该语谱图能直观地反映出语音信号中基音频率及共振峰的细节及其变化规律,为语音信号的分析提供了可视化的工具.在此基础上,对汉语单韵母音节的前两个共振峰进行了分析,在控制使用少数几个主...  相似文献   

13.
In this paper, a feature extraction (FE) method is proposed that is comparable to the traditional FE methods used in automatic speech recognition systems. Unlike the conventional spectral‐based FE methods, the proposed method evaluates the similarities between an embedded speech signal and a set of predefined speech attractor models in the reconstructed phase space (RPS) domain. In the first step, a set of Gaussian mixture models is trained to represent the speech attractors in the RPS. Next, for a new input speech frame, a posterior‐probability‐based feature vector is evaluated, which represents the similarity between the embedded frame and the learned speech attractors. We conduct experiments for a speech recognition task utilizing a toolkit based on hidden Markov models, over FARSDAT, a well‐known Persian speech corpus. Through the proposed FE method, we gain 3.11% absolute phoneme error rate improvement in comparison to the baseline system, which exploits the mel‐frequency cepstral coefficient FE method.  相似文献   

14.
针对人脸语音动画提出了基于小波包分析的语音特征提取算法,为了表征语音的动态特性,采用了特征差分和基于口形帧前后关联的多帧语音特征提取,井利用主成分分析(Principle Component Analysis,PCA)降低了输入语音的特征维数.基于隐马尔可夫模型(Hidden Markov Model,HMM)的可视语音合成系统的实验表明该算法提取的语音参数比传统的Mel频率倒谱系数(Mel-Frequency Cepstrum Coefficients,MFCC)合成的口形效果要好,有利于可视语音合成的研究.  相似文献   

15.
简志华  杨震 《信号处理》2007,23(3):383-387
本文提出了一种改进的倒谱域特征参数补偿算法GMCSM。根据语音信号的时变特性,GMCSM算法使用广义自回归条件异方差(Generalized Auto-Regressive Conditional Heteroscedasticity,GARCH)模型对语音信号的方差进行建模。实验数据表明,与常规倒谱相减法CSM和MEMCSM相比,GMCSM能够更有效地补偿因加性噪声引起的倒谱特征参数失真,减少识别的错误率,特别是在信噪比较低的情况下,GMCSM的性能更为显著。  相似文献   

16.
调制方式是通信信号的重要特征参数之一。在无线电监测领域,信号的调制识别研究具有十分重要的意义。基于某个无线电频谱监测系统,研究了8种模拟、数字信号的自动调制识别算法。针对AM和ASK的区分,设计了基于频谱紧致性的特征参数K;针对FM和FSK的区分,设计了基于频谱凹凸性的特征参数F。这些特征参数很好地解决了以往模拟、数字信号不能较好联合识别的问题,仿真结果表明了该算法的有效性。  相似文献   

17.
In this paper, a frequency domain feature extraction algorithm for palm-print recognition is proposed, which efficiently exploits the local spatial variations in a palm-print image. The entire image is segmented into several small spatial modules and the effect of modularization in terms of the entropy content of the palm-print images has been investigated. A palm-print recognition scheme is developed based on extracting dominant spectral features from each of these local modules using a two-dimensional discrete cosine transform (2D-DCT). The proposed dominant spectral feature selection algorithm offers the advantage of having very low feature dimension, and it is capable of capturing precisely the variations in detail within the palm-print image. It is shown that because of modularization of the palm-print image, the discriminating capabilities of the proposed features are enhanced, which results in a very high within-class compactness and between-class separability of the extracted features. A principal component analysis is performed to further reduce the feature dimension. From our extensive experimentations on different palm-print databases, it is found that the performance of the proposed method in terms of recognition accuracy and computational complexity is superior to that of some of the recent methods.  相似文献   

18.
人脸语音动画是虚拟现实领域的热点,语音特征参数提取是实现语音同步动画的前提和关键所在。为了能够提取鲁棒性更好的语音特征参数,在小波变换的理论基础上,借鉴MFCC特征参数的提取方法,运用表征语音动态特征的特征差分算法,提出了一种基于离散小波变换的语音特征参数(DWTMFCC)提取方法,并与反映语音情感特征的韵律参数相结合。通过基于LGB算法的VQ模型进行说话人语音识别,可以得到组合特征参数的识别率较高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号