首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
正反向隐马尔可夫模型及其在连续语音识别中的应用   总被引:1,自引:0,他引:1  
本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用语音反向依赖关系语音识别同样也能获得相当可观的识别性能。接着,本文针对孤立字和连续语音两种不同的识别任务,研究了在语音识别中同时利用这两种依赖信息的方法,并提出了一种连续语音识别中的新的搜索算法──正反向分半混合搜索。这种方法利用基于正向HMM的正向Viterbi搜索和基于反向HMM的反向Viterbi搜索的中间结果来有效地结合正反向依赖信息,实验证明正反向分半混合搜索方法确实一致地优于单用任何一种依赖信息的单向搜索识别方法。  相似文献   

2.
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。  相似文献   

3.
语音识别技术是让机器通过识别和理解过程把语音信号转变为相应的文本或命令,其识别过程与人对语音识别处理过程基本上是一致的,包括语音特征提取、声学模型与模式匹配(识别算法)、语言模型与语言处理三个部分。  相似文献   

4.
提出一种基于自组织神经网络的数字语音识别模型。首先用基于小波变换和线性预测的特征提取方法提取语音信号特征,用自组织神经网络进行识别判决。这种语音识别方法适合于小词汇量的孤立词识别,网络结构简单,所需训练数据十分的少,实时性能好。用MATLAB进行仿真实验,识别率达到98%。  相似文献   

5.
王兴斌  徐望  王炳锡  马治飞 《信号处理》2005,21(Z1):204-207
语音识别中,语音信号能量是一个重要的识别特征参数.在噪声环境下,语音信号能量产生的畸变是导致识别率下降的原因之一.本文依据RASTA-PLP分析的增益参数和最小均方误差估计准则,给出了带噪语音能量和干净语音信号能量的线性映射关系.在中文连续语音识别中的应用表明,利用该映射关系得到的干净语音能量估计,可使信噪比为5dB的白噪声环境下的识别正确率提高21.36%.  相似文献   

6.
语音信号中的情感特征分析和识别的研究   总被引:11,自引:0,他引:11  
本文分析了含有欢快、愤怒、惊奇、悲伤等4种情感语音信号的时间构造、振幅构造、基频构造和共振峰构造的特征。通过和不带情感的平静语音信号的比较,总结了不同情感语音信号的情感特征的分布规律。根据这些分析,提取了9个情感特征进行了情感识别的实验,获得了基本上接近于人的正常表现的识别结果。  相似文献   

7.
有序聚类方法及其在神经网络语音识别中的应用   总被引:3,自引:1,他引:2  
本文提出了一种新的网络结构,我们称之为有序聚类网络。这种网络能够对语音信号进行特征提取,很好地解决神经网络语音识别中的时间规整问题。有序聚类网络从输入语音信号的特征矢量序列中撮出一组固定数目的特 矢量,然后将这组特征矢量馈入神经网络分类器进行识别。和其他的神经网络语音识别方法相比较,用这种网络进行前端处理,可以缩短后端神经网络分类器的训练和识别时间,简化经分类器的网络产高的识别率。根据该 们建立了  相似文献   

8.
语音识别的非线性方法   总被引:5,自引:0,他引:5  
语音信号是一个复杂的非线性过程,这使得基于线性系统理论发展起来的传统语音识别技术性能难以进一步提高。近年来人们开始逐渐重视非线性在语音识别技术中的应用,本文概括地介绍了非线性理论在语音识别技术中的所取得的成果和发展方向,除了涉及较为流行的隐马尔柯夫过程和人工神经网络在语音识别中的应用外,文中着重论述了近年来发展迅猛的混沌,分形理论在语音识别中的应用,本文最后还提到不可忽视的分形理论在语音编码中的应  相似文献   

9.
语音信号互信息估计的非线性搜索算法及识别应用   总被引:6,自引:0,他引:6  
基于互信息理论的语音识别方法不仅考虑了语音信号的时变分布特征,并且考虑了语音信号的统计分布特征,能有效地提高同类模式的凝聚度,减少非同类模式间的耦合性,在语音识别实验和实际应用中反映出良好的识别精度和很高的运行效率,与其它方法相比更适合嵌入式系统的语音识别应用。本文提出了一种互信息估计的非线性搜索算法,这一算法能够有效地处理语音信号时变分布特征的非线性波动,进一步提高语音模式互信息匹配的精度。  相似文献   

10.
语音识别的互信息匹配模型及其应用   总被引:3,自引:1,他引:2  
俞一彪  赵鹤鸣 《通信技术》2001,(8):39-42,72
互信息是随机变量或随机信号之间所携带对方信息的定量描述。语音识别的互信息匹配模型依据互信息理论以及语音信号特征参数统计分析结果而提出,这一模型同时考虑了语音信号的时变发布特征和统计分布特征,能有效地提高同类模式的凝聚度,减少非同类模式间的耦合性。语音识别实验和实际应用表明,互信息匹配模型具有良好的识别精度和很高的运行效率,与其它模式匹配方法相比更适合嵌入式系统的语音识别应用。对互信息匹配模型的原理和特点进行了全面的阐述,并介绍了这一模型在几个语音识别系统中的具体应用。  相似文献   

11.
本文提出了一种由连续隐马尔可夫模型与多层感知器构成的混合模型,并将该模型应用于语音孤立词识别,这种混合模型首先用CDHMM来获取输入信号的动态特性,然后再以MLP分类器对输入信号进行分类识别。其主要目的是通过MLP分类器,对CDHMM中的似然估计值进行分析,分类,以加强和提高CDHMM的分类能力。根据这种混合模型,我们建立了一个含30个英语单词的语音识别系统。实验结果表明,该系统的识别率明显高于传  相似文献   

12.
利用模糊熵进行参数有效性分析的语音情感识别   总被引:4,自引:0,他引:4  
本文利用模糊熵理论来分析语音信号情感特征参数相对于识别情感模式的不确定度,并提出了一种利用模糊熵对情感参数有效性进行度量的方法。并将参数有效性分析结合模糊综合判别对情感语音信号作情感识别,取得了较好效果。  相似文献   

13.
语音识别技术及应用(上)   总被引:4,自引:0,他引:4  
引言 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。  相似文献   

14.
基于段长分布的HMM语音识别模型   总被引:23,自引:0,他引:23       下载免费PDF全文
王作英  肖熙 《电子学报》2004,32(1):46-49
本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型,证明了这种模型的状态转移概率表示与状态段长表示的等效性,并在此基础上提出了基于段长分布的HMM模型(DDBHMM).非特定人连续语音实验结果表明,仅仅利用状态段长信息的DDBHMM语音识别模型比经典HMM模型的性能有了明显的提高(误识率降低了17.8%),展示了DDBHMM的良好的性能,为语音信号的时长、语速、时间断续性以及语音特征的相关性等重要特征的描述和利用开辟了空间.  相似文献   

15.
用户不断地要求所用装置更小、 更轻便同时又更易于使用。能解决这三方面问题的一种可行技术就是语音识别。这种技术由于消除了传统的输入器件(如键盘或笔接口),故具备更小和更轻便的特点。 解决容易使用问题更需要有一点技巧,视装置所采用的技术是否恰当。从某种意义上讲,这又必须根据目标应用是什么而采取不同的处理。语音识别两个最通用的模式是语音从属和语音独立。 语音从属与语音独立 语音从属意味着必须有培训系统而且通常它只可识别培训系统的人所讲的词。语音独立系统则可以识别几乎所有讲话人的词。在这种情况下,可以听懂的…  相似文献   

16.
汉语语音理解系统的任务之一是把语音识别系统获得的汉语单单节转换成正确的汉字,词乃至汉语的短语,语句,与误音识别系统一起,完成一个语音到文本(speechtotext)的转换系统,本文利用一个闭环反馈方式汉语语音识别理解方案,在汉语词识别理解的基础上,进一步实现时汉语结构性短的识别理解,获得了预期的结果,最后本文对实验结果和反馈式语音识别理解方案进行了讨论。  相似文献   

17.
一种基于LabVIEW和MATLAB的语音识别方法   总被引:1,自引:0,他引:1  
  相似文献   

18.
一种面向语音识别的新型神经网络   总被引:1,自引:0,他引:1  
提出了一种新型神经网络模型,描述了该网络的工作原理和训练方法以及识别算法。为克服神经网络对时序信号建模能力差的缺点,引入了非线性分段处理和代表帧特征提取方法。最后介绍了根据这一模型所设计的一个汉语语音识别系统,试验表明该网络在汉语语音识别方面具有较大的潜力。  相似文献   

19.
黄程韦  金赟  包永强  余华  赵力 《信号处理》2013,29(1):98-106
本文中我们提出了一种将高斯混合模型同马尔可夫网络结合的时域多尺度语音情感识别框架,并将其应用在耳语音情感识别中。针对连续语音信号的特点,分别在耳语音信号的短句尺度上和长句尺度上进行了基于高斯混合模型的情感识别。根据情绪的维度空间论,耳语音信号中的情感信息具有时间上的连续性,因此利用三阶的马尔可夫网络对多尺度的耳语音情感分析进行了上下文的情感依赖关系的建模。采用了一种弹簧模型来定义二维情感维度空间中的高阶形变,并且利用模糊熵评价将高斯混合模型的似然度转化为马尔可夫网络中的一阶能量。实验结果显示,本文提出的情感识别算法在连续耳语音数据上获得了较好的识别结果,对愤怒的识别率达到了64.3%。实验结果进一步显示,与正常音的研究结论不同,耳语音中的喜悦情感的识别相对困难,而愤怒与悲伤之间的区分度较高,与Cirillo等人进行的人耳听辨研究结果一致。   相似文献   

20.
语音识别是当今世界尖端科技之一,是一门典型的交叉学科。在计算机通信和机器人等领域有很好的应用前景。本文较详细地介绍了语音识别的一般原理,归纳总结了笔者在研究语音识别时所遇到的难点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号