首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
近年来在大词汇连续语音识别的研究取得了长足的进步,隐马尔柯夫模型(HMM)是连续语音识别的核心部分。但是HMM对语音信号的描述不完善,为此人们提出了很多替代模型,其中一类将语音信号描述为长度随机的特征矢量序列,称为随机分段模型(Stochastic Segment Models),简称为分段模型(SM)。该文将首先阐述分段模型的原理,并将分段模型和隐马尔柯夫模型进行比较,其次给出基于分段模型的识别和模型训练算法,最后给出实验结果并进行了讨论。  相似文献   

2.
本文在简单介绍三种词组语音识别模型后,提出了采用离散隐马尔柯夫模型(DHMM)来构建语音识别系统,并在此基础上引入矢量量化(VQ)模块来保证识别率和识别速度,具有良好的实用性  相似文献   

3.
HMM方法在手语识别中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
HMM在语音识别中已得到广泛应用。近年来,HMM方法在手语识别领域越来越受到关注。本文综述了HMM方法在该领域应用的情况,并结合中国手语及其具体特点,对HMM方法在手语识别领域中的应用前景进行了展望 。  相似文献   

4.
语音识别是研究让机器能够听懂人类口述的自然语言的一门学科,其最终目标是实现入与机器进行自然语言通信。介绍了语音识别的关键技术,主要有语音识别单元选取、特征参数提取技术、模式匹配准则及模型训练技术三个方面,通过具体的实现方法对各种技术作出介绍,以达到在语音识别中提高识别率的效果。最后对各种技术以及语音识别系统的作用和意义作出简要总结。  相似文献   

5.
随着计算机技术的不断发展和信息技术的不断进步,各类智能机器也逐步进入到人们的生活中.语音识别是一种前景广阔、社会效益广泛、经济效益明显的技术,在快速发展的同时也不可避免地产生了一些问题.本文主要针对基于HMM和神经网络的语音识别系统进行了细致的分析,期待能对我国语音识别系统的研究和实践提供有效的借鉴和参考.  相似文献   

6.
语音识别技术是一个涉及多种学科的集成技术,目前已在工业、军事和医疗部门,产品检验和人机语音通信等领域取得了广泛的实际应用.语音识别技术长期以来一直是研究热点,但现有的语音识别系统运行缓慢,成本高,不方便使用.这些缺点影响了语音识别的速度,系统的硬件实现和应用.特别是在吵闹的环境中应用智能机器人语音识别更是非常困难.用于识别的工业智能机器人技术研究也越来越受到人们的关注.  相似文献   

7.
语音识别技术概述   总被引:5,自引:0,他引:5  
杨尚国  杨金龙 《福建电脑》2006,(8):50-50,34
本文阐述语音识别的发展过程、基本方法以及语音识别系统的分类,分析了语音识别所面临的问题。  相似文献   

8.
基于神经网络的语音识别技术应用研究   总被引:2,自引:0,他引:2  
简单叙述了采用人工神经网络技术进行语音识别的原理,给出了其中关键技术:求解语音特征参数和典型神经网络的学习过程。然后通过二个具体应用实例,展示了如何使这一技术实用化。  相似文献   

9.
基于循环神经网络的语音识别模型   总被引:4,自引:1,他引:4  
朱小燕  王昱  徐伟 《计算机学报》2001,24(2):213-218
近年来基于隐马尔可夫模型(HMM)的语音识别技术得到了很大发展。然而HMM模型有着一定的局限性,如何克服HMM的一阶假设和独立性假设带来的问题一直是研究讨论的热点,在语音识别中引入神经网络的方法是克服HMM局限性的一条途径。该文将循环神经网络应用于汉语语音识别,修改了原网络模型并提出了相应的训练方法,实验结果表明该模型具有良好的连续信号处理性能,与传统的HMM模型效果相当,新的训练策略能够在提高训练速度的同时,使得模型分类性能有明显提高。  相似文献   

10.
基于动静态组合特征参数的语音识别   总被引:1,自引:0,他引:1  
基于语音信号的时变特性,本文提出了动静态特征参数结合的语音信号识别方法,首先在特征参数提取中引入了小波包变换,借助MFCC(Mel-Frequency Cepstrum Coefficient)参数的提取方法,用小波包变换代替傅立叶变换和Mel滤波器组,提取了新的静态特征参数DWPTMFCC(Discrete Wavelet Packet Transform Mel-Frequency Coefficient),然后把它与一阶DWPTMFCC差分参数相结合成一个向量,作为一帧语音信号的参数,通过试验和仿真,此参数具有很高的识别率,是一种很好的语音特征参数.并且把混沌特性引入到神经元,构成混沌神经网络,把这种神经网络用于语音识别,并与常用的BP神经网络识别方法进行了比较.试验结果表明,混沌神经网络的平均识别率要高于同等条件下常用的神经网络方法的识别率.  相似文献   

11.
12.
隐马尔柯夫模型(HMM)的传统训练方法-Beum-Welch算法只能得到 一个局部最优模型,从而影响最终的识别率。对于CHMM,分段K平均方法来取得一个初始值可以解决这一问题,但对DHMM却改进不大。而基于全局搜索的进化计算的一个重要特点便是可以得到次优解乃至全局最优解。本文把进化计算引入到DHMM的训练中去,提出了一种改进的进化训练贪污,实验结果表明,这种训练方法初具了全局搜索和快速收敛的特点, 得到的模型优于传统方法和直接用进化计算所得的模型,提高了系统的识别率。  相似文献   

13.
汉语语音识别实用系统研究   总被引:1,自引:0,他引:1  
姚键  古碧绮 《计算机工程》1999,25(4):12-13,52
在分析了传统音识别方法的特点后,提出一种规则结合模型的语音识别思想,并实现了特征空间轨迹匹配+神经网络”方法作为例证。  相似文献   

14.
语音识别技术展望   总被引:1,自引:0,他引:1  
<正> 自从ENIAC问世之后,立即有人想到要让计算机听懂人说话,并开始了这方面的研究工作。所以说,语音识别的研究历史与计算机的发展历史一样长。计算机的发展已历经了从电子管到晶体管以至超大规模集成电路的好几代,单单微机的CPU就从早期的4004发展到今天的奔腾三代,涌入了普通家庭,已与我们的数字化生活密不可分。但是,与计算机同步发展的语音识别技术似乎并不遵循摩尔规律,它的产品也迟迟未能进入市场。时至今日,语音技术产品的市场日益升温,语音识别技术已经成为计算机进一步在亿万百姓中普及的关键技术,也必将成为信息产业的标志性技术和未来计算机的重要特征。  相似文献   

15.
计算机能听懂人的语言,这意味着人工智能时代已向我们走来c北京中自汉王科技公司在IBM支持下,基于ViaVoice自行开发的一种最新语音识别软件与手写输入系统——汉王听写系统,它把IBM研究开发的语音识别核心技术与汉三优秀的手写汉字识别输入系统完美的集成在一起.形成了一个优势互补的非键盘输入系统。成为一种简单方便,人人会用的文字录入工具。这不仅提高了汉字输入速度,而且使讲话人更自然、更流畅地表达自己的意愿。汉王听写系统,具有汉语语音听写输入、语音命令、编辑、打印功能,基于中文自身的特点,同音字多,有声调、词…  相似文献   

16.
利用语音传递信息是人类最常用,最方便,最快捷的一种方式。人类最常用的传递信息的方式就是声音,随着现代信息化时代的不断发展,人们更加深入的研究语音信号的处理技术,并且由于语音的特殊作用及其重要性,还有其对人们生活的不断深入的影响,使得其十分受关注。语音识别技术就是将说话人的语言转变为计算机可以听懂的语言,语音识别技术的涉及面极广,它涉及到多个学术领域,如计算机科学、语言学、神经生理学、信号处理以及人工智能等。  相似文献   

17.
针对带噪面罩语音识别率低的问题,结合语音增强算法,对面罩语音进行噪声抑制处理,提高信噪比,在语音增强中提出了一种改进的维纳滤波法,通过谱熵法检测有话帧和无话帧来更新噪声功率谱,同时引入参数控制增益函数;提取面罩语音信号的Mel频率倒谱系数(MFCC)作为特征参数;通过卷积神经网络(CNN)进行训练和识别,并在每个池化层后经局部响应归一化(LRN)进行优化.实验结果表明:该识别系统能够在很大程度上提高带噪面罩语音的识别率.  相似文献   

18.
语音情感识别的研究进展   总被引:4,自引:0,他引:4  
总结了语音情感识别研究的主要成果,分析了带有情感的语音的特征,阐述了现有的几种从语音中提取情感的方法,并对其进行分析比较,指出了语音情感识别技术的可能发展趋势。  相似文献   

19.
20.
基于CHMM的语音识别系统识别率高,但却占用系统资源较大,从而限制了其在资源受限的实际应用环境的有效实现.针对上述问题,给出特征参数选择的理论依据,弥补以往研究仅从实验结果分析,缺少理论依据的不足;同时提出根据各特征参数对系统误识率的影响程度来选择特征参数的新方法.该方法能使系统在训练,识别过程中的计算量和存储量明显减小,同时系统误识率不会显著改变.这为资源受限的语音识别系统,提供新的思路和有效的特征参数选择方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号