首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
神经网络与HMM构成的混合网络在语音识别中应用的研究   总被引:7,自引:0,他引:7  
李苇营  易克初 《电子学报》1994,22(10):73-80
隐马尔可夫模型(HMM)技术是语音识别中应用较为成功的算法,但它的缺点影响了其精度、速度、硬件实现和推广应用。神经网络(NN)具有并行性、强的分类能力和易于硬件实现等优点。将NN与HMM相结合构成混合网络,能克服HMM与NN的缺点,保留双方的优点。本文详细评述了目前在语音识别中应用的由HMM和NN构成的四种混合网络。通过对其结构、识别性能和特点的分析,可以看出HMM和NN构成的混合网的性能明显优于  相似文献   

2.
提出一种基于隐马尔可夫模型(HMM)和学习向量量化(LVQ)神经网络的语音识别方法.该方法先用HMM生成最佳语音状态序列,然后用函数逼近技术产生对最佳状态序列进行时闻归正,最后通过LVQ神经网络进行分类识别.理论和实验结果表明,混合模型的识别率明显高于隐马尔可夫模型的识别率.  相似文献   

3.
从线性预测HMM到一种新的语音识别的混合模型   总被引:1,自引:0,他引:1       下载免费PDF全文
欧智坚  王作英 《电子学报》2002,30(9):1313-1316
线性预测HMM(Linear Prediction HMM,LPHMM)并没有象传统HMM那样引入状态输出独立同分布假设,但实用中识别性能并不佳.通过分析两种HMM的各自优劣,本文提出了一种新的语音识别的混合模型,将语音静态特性(基于传统HMM)和动态特性(基于LPHMM)分别描述又有机结合在一起,更为精确地刻划了真实的语音现象,同时又继承使系统的实现改动很小和较小的计算量.汉语大词汇量非特定人连续语音识别的实验表明,混合模型的识别性能显著好于LPHMM和传统HMM.理论上,本文还给出了LPHMM的一组闭式参数重估公式.  相似文献   

4.
戴加宁 《电子学报》1997,25(7):75-77
本文探讨经短时信号处理后的语音信号帧间相关信息对基于隐马尔可夫模型(HMM)的语音识别系统识虽精度的影响,鉴于HMM的输出独立假设导致语音帧间相关信息的损失,本文提出了一种描述帧间相关信息的统计模型-马尔可夫链(MCM)用来弥补HMM在这方面的缺陷;经非特定人和多话者孤立字实验表明,用MCM作为HMM的辅助模型,可将原有HMM系统的识别率提高约1~6个百分点。  相似文献   

5.
沈泉波 《电声技术》2012,36(10):56-57,70
隐马尔可夫模型(HMM)已成为语音识别中的主流技术,首先介绍了语音识别技术的原理和结构,然后介绍了HMM的三个基本问题及其解决方法,最后利用Matlab仿真工具设计了一个孤立词的语音识别系统,实现了数字0~9的识别.  相似文献   

6.
语音识别HMM中引入帧间相关信息的一种参数化模型   总被引:4,自引:1,他引:3  
杨浩荣  王作英  陆大 《电子学报》1998,26(10):50-54,8
虽然隐马尔可夫模型(HMM)是当前最为流行的语音识别模型,但由于一般都采用了状态输出独立假设,因此存在着不能描述语音现象中时间相关性的固有缺陷,本文提出的新模型对语音状态输出特征矢量序列的静态和动态特性信息分别进行参数化建模,然后将它们结合在一起,由此在基于段长分布的HMM(DDBHMM)中引入了帧间相关信息,这种上引入帧间相关信息的HMM能够更为精确地描述真实的语音现象。本文在给出新模型的框架后  相似文献   

7.
基于PCANN/HMM混合结构的语音识别方法   总被引:1,自引:0,他引:1  
赵力  邹采荣  吴镇扬 《信号处理》2001,17(5):473-476
本文提出了一种基于PCANN/HMM混合结构的语音识别方法,它采用相继几帧组成的特征参数矢量作为语音识别HMM的输入,能有效地在语音识别HMM中引入帧间相关信息,同时为了改善多帧特征输入HMM的输出概率密度函数性能,在HMM的前端增加语音参数压缩的主分量分析神经网络(PCANN).通过对多讲者汉语连续语音识别实验,证实了本文提出方法的有效性.  相似文献   

8.
利用隐马尔可夫模型(HMM)的动态时间序列建模能力及神经网络的模式分类能力,构成混合语音识别模型,同时考虑到语音信号的非平稳性,采用小波分析方法提取语音特征向量。通过时间规整方法,将所有具有可变长度的语音特征向量转换为相同维数的特征向量,从而简化了神经网络的结构。仿真结果表明,采用混合语音识别模型以及时间规整方法,不仅可提高识别率,同时大大缩减了训练时间,获得了很好的识别效果。  相似文献   

9.
HMM 在说话人识别中的应用   总被引:9,自引:0,他引:9  
本文介绍了隐马尔可夫模型在自动说话人识别中的应用,指出了目前说话人识别技术中存在的一些问题和今后需要的课题。  相似文献   

10.
欧智坚  王作英 《电子学报》2003,31(4):608-611
尽管作为当前最为流行的语音识别模型, HMM由于采用状态输出独立同分布假设,忽略了对语音轨迹动态特性的描述.本文基于一个更为灵活的语音描述统计框架—广义DDBHMM,提出了一个具体的多项式拟合语音轨迹模型,以及新的训练和识别算法,更好地刻划了真实的语音特性.本文还给出了一种有效的剪枝算法,得到一个实用化模型.汉语大词汇量非特定人连续语音识别的实验表明,这种剪枝的多项式拟合语音轨迹模型以较少的计算量明显改善了识别系统的性能.  相似文献   

11.
正反向隐马尔可夫模型及其在连续语音识别中的应用   总被引:1,自引:0,他引:1  
本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用语音反向依赖关系语音识别同样也能获得相当可观的识别性能。接着,本文针对孤立字和连续语音两种不同的识别任务,研究了在语音识别中同时利用这两种依赖信息的方法,并提出了一种连续语音识别中的新的搜索算法──正反向分半混合搜索。这种方法利用基于正向HMM的正向Viterbi搜索和基于反向HMM的反向Viterbi搜索的中间结果来有效地结合正反向依赖信息,实验证明正反向分半混合搜索方法确实一致地优于单用任何一种依赖信息的单向搜索识别方法。  相似文献   

12.
This paper presents the design of a speech recognition IC using hidden Markov models (HMMs) with continuous observation densities. Results of offline and live recognition tests are also given. Our design employs a table look-up method to simplify the computation and hence the architecture of the circuit. Currently each state of the HMMs is represented by a double-mixture Gaussian distribution. With minor modifications, the proposed architecture can be extended to implement a recognizer in which models with higher order multi-mixture Gaussian distribution are used for more precise acoustic modeling. The test chip is fabricated with a 0.35 μm CMOS technology. The maximum operating frequency is 62.5 MHz at 3.3 V. For a 50-word vocabulary, the estimated recognition time is about 0.16 s. Using noise-corrupted utterances, the recognition accuracy is 93.8% for isolated English digits. Such a performance is comparable to the software implementation with the same algorithm. Live recognition test was also run for a vocabulary of 11 Chinese words. The accuracy is 91.8% for five male and five female speakers.
Wei HanEmail:
  相似文献   

13.
语音识别隐马尔可夫模型的改进   总被引:7,自引:1,他引:6  
由于在语音识别中被广泛应用的隐马尔可夫模型是一重马尔可夫模型,它不能充分地描述语音信号的时间相依性。虽然理论上可将HMM扩展成多重马尔可夫模型,但由于所需运算量和存储量将成指数增长而使其难以应用。因此,本文提出一种新模型,它是由HMM与一个能描述语音信号时间相依性的多维高斯密度函数相结合构成的。本文从理论上论证了新模型的合理性。对汉语不计声调的全部409个单音节的识别实验结果表明:新模型的识别率显  相似文献   

14.
基于隐马尔可夫模型(HMM)的人脸表情识别   总被引:1,自引:1,他引:1  
王冲 《通信技术》2007,40(11):359-361
人脸表情识别是目前的研究热点.文中介绍了人脸表情识别的过程,给出了基于隐马尔可夫模型(HMM)的人脸表情识别方法.通过分析人脸表情的变化情况,利用二维离散余弦变换(2D—DCT)提取脸部表情特征,经过大样本训练构建HMM模型来识别图像中的人脸表情.实验结果表明该方法是一种高效的面部表情识别方法。  相似文献   

15.
马帅  高岳  何翔宇 《电子质量》2011,(4):17-18,21
HMM模型(隐含马尔科夫模型)由于对时间序列结构具有较强的建模能力.而逐步成为主流的语音识别技术.该文首先深入浅出地概述了基于HMM的语音识别技术,然后介绍了三个基本问题,最后在MATLAB下实现了孤立词语音识别系统.  相似文献   

16.
谢锦辉 《通信学报》1994,15(2):83-87
本文简要讨论了在基于HMM的连续语音识别系统中怎样选取基本语音单元的问题,介绍了在欧洲Polyglot课题下在法国LINSI-CNRS建立的基于上下文无关音素HMM。然后,本文详细给出了利用左或右上下文相关音素HMM,作者对上述系统改进后进行的连续语音识别,有用美国语音库DARPA-RM1,在不考虑句法信息时,我们获得了连续时词识别率大约3-10个百分点的明显提高。实验是在法国LIMSI-CNRS  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号