共查询到20条相似文献,搜索用时 15 毫秒
1.
正反向隐马尔可夫模型及其在连续语音识别中的应用 总被引:1,自引:0,他引:1
本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用语音反向依赖关系语音识别同样也能获得相当可观的识别性能。接着,本文针对孤立字和连续语音两种不同的识别任务,研究了在语音识别中同时利用这两种依赖信息的方法,并提出了一种连续语音识别中的新的搜索算法──正反向分半混合搜索。这种方法利用基于正向HMM的正向Viterbi搜索和基于反向HMM的反向Viterbi搜索的中间结果来有效地结合正反向依赖信息,实验证明正反向分半混合搜索方法确实一致地优于单用任何一种依赖信息的单向搜索识别方法。 相似文献
2.
《卫星电视与宽带多媒体》2011,(7):36-39
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 相似文献
3.
4.
5.
6.
7.
8.
语音识别的非线性方法 总被引:5,自引:0,他引:5
语音信号是一个复杂的非线性过程,这使得基于线性系统理论发展起来的传统语音识别技术性能难以进一步提高。近年来人们开始逐渐重视非线性在语音识别技术中的应用,本文概括地介绍了非线性理论在语音识别技术中的所取得的成果和发展方向,除了涉及较为流行的隐马尔柯夫过程和人工神经网络在语音识别中的应用外,文中着重论述了近年来发展迅猛的混沌,分形理论在语音识别中的应用,本文最后还提到不可忽视的分形理论在语音编码中的应 相似文献
9.
10.
语音识别的互信息匹配模型及其应用 总被引:3,自引:1,他引:2
互信息是随机变量或随机信号之间所携带对方信息的定量描述。语音识别的互信息匹配模型依据互信息理论以及语音信号特征参数统计分析结果而提出,这一模型同时考虑了语音信号的时变发布特征和统计分布特征,能有效地提高同类模式的凝聚度,减少非同类模式间的耦合性。语音识别实验和实际应用表明,互信息匹配模型具有良好的识别精度和很高的运行效率,与其它模式匹配方法相比更适合嵌入式系统的语音识别应用。对互信息匹配模型的原理和特点进行了全面的阐述,并介绍了这一模型在几个语音识别系统中的具体应用。 相似文献
11.
本文提出了一种由连续隐马尔可夫模型与多层感知器构成的混合模型,并将该模型应用于语音孤立词识别,这种混合模型首先用CDHMM来获取输入信号的动态特性,然后再以MLP分类器对输入信号进行分类识别。其主要目的是通过MLP分类器,对CDHMM中的似然估计值进行分析,分类,以加强和提高CDHMM的分类能力。根据这种混合模型,我们建立了一个含30个英语单词的语音识别系统。实验结果表明,该系统的识别率明显高于传 相似文献
12.
13.
语音识别技术及应用(上) 总被引:4,自引:0,他引:4
引言 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。 相似文献
14.
本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型,证明了这种模型的状态转移概率表示与状态段长表示的等效性,并在此基础上提出了基于段长分布的HMM模型(DDBHMM).非特定人连续语音实验结果表明,仅仅利用状态段长信息的DDBHMM语音识别模型比经典HMM模型的性能有了明显的提高(误识率降低了17.8%),展示了DDBHMM的良好的性能,为语音信号的时长、语速、时间断续性以及语音特征的相关性等重要特征的描述和利用开辟了空间. 相似文献
15.
用户不断地要求所用装置更小、 更轻便同时又更易于使用。能解决这三方面问题的一种可行技术就是语音识别。这种技术由于消除了传统的输入器件(如键盘或笔接口),故具备更小和更轻便的特点。 解决容易使用问题更需要有一点技巧,视装置所采用的技术是否恰当。从某种意义上讲,这又必须根据目标应用是什么而采取不同的处理。语音识别两个最通用的模式是语音从属和语音独立。 语音从属与语音独立 语音从属意味着必须有培训系统而且通常它只可识别培训系统的人所讲的词。语音独立系统则可以识别几乎所有讲话人的词。在这种情况下,可以听懂的… 相似文献
16.
汉语语音理解系统的任务之一是把语音识别系统获得的汉语单单节转换成正确的汉字,词乃至汉语的短语,语句,与误音识别系统一起,完成一个语音到文本(speechtotext)的转换系统,本文利用一个闭环反馈方式汉语语音识别理解方案,在汉语词识别理解的基础上,进一步实现时汉语结构性短的识别理解,获得了预期的结果,最后本文对实验结果和反馈式语音识别理解方案进行了讨论。 相似文献
17.
18.
一种面向语音识别的新型神经网络 总被引:1,自引:0,他引:1
提出了一种新型神经网络模型,描述了该网络的工作原理和训练方法以及识别算法。为克服神经网络对时序信号建模能力差的缺点,引入了非线性分段处理和代表帧特征提取方法。最后介绍了根据这一模型所设计的一个汉语语音识别系统,试验表明该网络在汉语语音识别方面具有较大的潜力。 相似文献
19.
本文中我们提出了一种将高斯混合模型同马尔可夫网络结合的时域多尺度语音情感识别框架,并将其应用在耳语音情感识别中。针对连续语音信号的特点,分别在耳语音信号的短句尺度上和长句尺度上进行了基于高斯混合模型的情感识别。根据情绪的维度空间论,耳语音信号中的情感信息具有时间上的连续性,因此利用三阶的马尔可夫网络对多尺度的耳语音情感分析进行了上下文的情感依赖关系的建模。采用了一种弹簧模型来定义二维情感维度空间中的高阶形变,并且利用模糊熵评价将高斯混合模型的似然度转化为马尔可夫网络中的一阶能量。实验结果显示,本文提出的情感识别算法在连续耳语音数据上获得了较好的识别结果,对愤怒的识别率达到了64.3%。实验结果进一步显示,与正常音的研究结论不同,耳语音中的喜悦情感的识别相对困难,而愤怒与悲伤之间的区分度较高,与Cirillo等人进行的人耳听辨研究结果一致。 相似文献
20.
语音识别是当今世界尖端科技之一,是一门典型的交叉学科。在计算机通信和机器人等领域有很好的应用前景。本文较详细地介绍了语音识别的一般原理,归纳总结了笔者在研究语音识别时所遇到的难点。 相似文献