首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
基于MI_OneStage算法的连续数字语音识别   总被引:1,自引:0,他引:1  
语音识别的互信息匹配模型是依据互信息理论而提出的。在互信息匹配理论的现有成果的基础上,提出了基于互信息估计的连续语音识别算法—MI_OneStage算法,实验表明所提出的算法简单有效,优于传统的OneStage算法。  相似文献   

2.
语音信号互信息估计的非线性搜索算法及识别应用   总被引:6,自引:0,他引:6  
基于互信息理论的语音识别方法不仅考虑了语音信号的时变分布特征,并且考虑了语音信号的统计分布特征,能有效地提高同类模式的凝聚度,减少非同类模式间的耦合性,在语音识别实验和实际应用中反映出良好的识别精度和很高的运行效率,与其它方法相比更适合嵌入式系统的语音识别应用。本文提出了一种互信息估计的非线性搜索算法,这一算法能够有效地处理语音信号时变分布特征的非线性波动,进一步提高语音模式互信息匹配的精度。  相似文献   

3.
通常采用具有前向连接权的连接网络便可实现静态输入输出模式对的联想,但是为了使网络记忆序列信息状态,必须考虑引入反馈连接权。本文构造一个具有动态神经元的多层网络结构,动态神经元带有多时延的局部反馈。此网络结构用于记忆时间序列信息,同时,相应地我们推导一种更有效、更便于实现的网络学习算法。最后,为了测试所提出网络学习动态时变数据的能力,选择几个不同参数的动态神经元模型,进行了一系列实验。  相似文献   

4.
5.
语音识别的互信息匹配模型及其应用   总被引:3,自引:1,他引:2  
俞一彪  赵鹤鸣 《通信技术》2001,(8):39-42,72
互信息是随机变量或随机信号之间所携带对方信息的定量描述。语音识别的互信息匹配模型依据互信息理论以及语音信号特征参数统计分析结果而提出,这一模型同时考虑了语音信号的时变发布特征和统计分布特征,能有效地提高同类模式的凝聚度,减少非同类模式间的耦合性。语音识别实验和实际应用表明,互信息匹配模型具有良好的识别精度和很高的运行效率,与其它模式匹配方法相比更适合嵌入式系统的语音识别应用。对互信息匹配模型的原理和特点进行了全面的阐述,并介绍了这一模型在几个语音识别系统中的具体应用。  相似文献   

6.
研究了损失函数为0-1损失和平方损失两种情形下HMM参数的分段统计Bayes估计。根据语音识别的具体情况,在一定条件下给出其近似解法,和传统的算法不同在于,求分段统计Bayes估计不需迭代,只需加入平稳段分割和简单统计,运算量大大减少,应用甚为方便。  相似文献   

7.
基于3维空间Viterbi算法的汉语连续语音识别方法   总被引:1,自引:0,他引:1       下载免费PDF全文
赵力  邹采荣  吴镇扬 《电子学报》2000,28(7):67-69,58
本文提出了基于3维空间Viterbi算法的汉语连续语音识别方法。本方法采用60个音素单位的隐马尔可大模型(HMM)和8个声调单位的HMM作为识别用基元模型。音素基元模型和声调基元模型的识别结果的统合,采用音素单位的HMM状态,声调单位的HMM状态和时间的3维空间Viterbi算法来实现。  相似文献   

8.
汉语数码语音识别自适应算法   总被引:4,自引:0,他引:4  
说话人自适应是提高非特定人语音识别性能的有效方法之一。本文将MAP算法应用于汉语数码语音识别中,并讨论了几种加快自适应速度的方法以及自适应对非自适应人的影响。实验表明,MAP算法可以有效地降低汉语数码识别对被适应人的误识率,而且对非自适应人性能影响很小。  相似文献   

9.
基于DTW算法的语音识别电话系统   总被引:2,自引:0,他引:2  
介绍了动态时间伸缩算法在语音识别电话系统中的应用。阐述了语音识别电话系统的硬件结构及算法在该系统的实现过程。  相似文献   

10.
基于ANN的汉语数字语音识别   总被引:1,自引:0,他引:1  
本文介绍了在语音识别中使用人工神经网络构成识别系统的新方法,分析了它与传统识别方法的不同及优越性,并以BP网络构成不定人汉语数字语音识别器,通过计算机模拟实验表明,勘误别性能明显优于同样条件下HMM识别器,证明了用ANN进行语音识别是一种具吸引力有发展前途的新方法。  相似文献   

11.
提出了一种结合韵律信息的高性能汉语连续数字语音识别算法,该识别算法基于CHMM(连续隐马尔可夫模型),采用MFCC(MEL频率倒谱系数)为主要语音特征参数,结合韵律信息进行连续数字精确分割,能够有效区分易混数字。算法采用两级识别框架来提高语音识别率,其中,第1级对连续数字分割,在此基础上进行数字语音识别,输出各候选结果,第2级在候选结果中确定易混数字对,并运用韵律信息进一步选择正确结果。实验表明,最终汉语连续数字语音识别率有很大提高。  相似文献   

12.
唐艺明 《电子质量》2013,(10):43-46
语音识别(speech Recognition)是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。该文通过采用互相关卷积算法,实现对韵母(a,o,e,i,u,ǖ)的识别进行了初步的研究和探讨,实现了在MATLAB环境下对韵母(a,o,e,i,u,ǖ)的语音识别,并针对语音识别系统的频谱与互相关卷积的主要特点做出了总结与分析。  相似文献   

13.
俞一彪  王朔中 《信号处理》2002,18(5):442-447
互信息作为一种模式距离测度已经被成功地应用在语音识别中,并由此提出了语音识别的互信息匹配模型。本文运用统计方法对互信息测度的聚类特性进行了分析,对其实际识别性能进行了实验评价,并与传统的距离测度Euclidean,Mahalanobis和Itakura-Saito进行了比较。分析与实验表明,互信息测度具有较好的聚类特性,相应的类内凝聚度较高,类间耦合度较小,在采用线性预测倒谱系数LPCC作为特征参数时,运用互信息测度的错误识别率较小,仅为运用Euclidean测度时的50%。  相似文献   

14.
递归神经网络(Recurrent Neural Network, RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition, ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用场景中。由于递归神经网络采用的输入特征通常有较长的上下文,因此利用重叠信息来同时降低声学后验和令牌传递的时间复杂度成为可能。该文介绍了一种新的解码器结构,通过有规律抛弃存在重叠的帧来获得解码过程中的计算开销降低。特别地,这种方法可以直接用于原始的递归神经网络模型,只需对隐马尔可夫模型(Hidden Markov Model, HMM)结构做小的变动,这使得这种方法具有很高的灵活性。该文以时延神经网络为例验证了所提出的方法,证明该方法能够在精度损失相对较小的情况下取得2~4倍的加速比。  相似文献   

15.
基于一种改进的监督流形学习算法的语音情感识别   总被引:2,自引:0,他引:2  
为了有效提高语音情感识别的性能,需要对嵌入在高维声学特征空间的非线性流形上的语音特征数据作非线性降维处理。监督局部线性嵌入(SLLE)是一种典型的用于非线性降维的监督流形学习算法。该文针对SLLE存在的缺陷,提出一种能够增强低维嵌入数据的判别力,具备最优泛化能力的改进SLLE算法。利用该算法对包含韵律和音质特征的48维语音情感特征数据进行非线性降维,提取低维嵌入判别特征用于生气、高兴、悲伤和中性4类情感的识别。在自然情感语音数据库的实验结果表明,该算法仅利用较少的9维嵌入特征就取得了90.78%的最高正确识别率,比SLLE提高了15.65%。可见,该算法用于语音情感特征数据的非线性降维,可以较好地改善语音情感识别结果。  相似文献   

16.
基于DTW算法的语音识别系统实现   总被引:10,自引:0,他引:10  
动态时间归整(DTW)算法的实现简单有效,在孤立词语音识别系统中得到了广泛的应用.介绍了将DTW算法移植到TMS320VC5402上实现孤立词语音识别的原理、系统硬件组成和软件设计.研究结果表明,系统能满足实时性能要求,识别效果良好.  相似文献   

17.
语音识别算法的确定与实现   总被引:1,自引:0,他引:1  
在语音识别的实验中,对几种算法方案进行了比较、分析和择优淘劣,标准是在一定词汇量的条件下,权衡占用机器的内存空间、(正确)识别率和响应速度。力争使与话者有关的单词语音识别系统的设计达到优化,取得满意的结果。本文即是此项实验的总结。  相似文献   

18.
根据混沌编码具有联想记忆的特点,本文提出了一种基于混沌编码的语音识别新方法,该方法首先解决了语音特征矢量维数不固定难于进行混沌编码的难题,其次提出了多样本下语音信号特征的选取原则。实验结果表明,新方法对语音的缺损和噪声干扰具有较好的容错能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号