首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于经典隐马尔可夫模型的汉语连续语音识别系统   总被引:1,自引:0,他引:1  
该文构造了基于经典隐马尔可夫模型(Hidden Markov Model,HMM)的汉语连续语音识别系统,定量地分析与评价了经典HMM的性能。  相似文献   

2.
沈泉波 《电声技术》2012,36(10):56-57,70
隐马尔可夫模型(HMM)已成为语音识别中的主流技术,首先介绍了语音识别技术的原理和结构,然后介绍了HMM的三个基本问题及其解决方法,最后利用Matlab仿真工具设计了一个孤立词的语音识别系统,实现了数字0~9的识别.  相似文献   

3.
采用离散HMM的孤立词识别系统   总被引:3,自引:0,他引:3  
探讨了离散马尔可夫模型的基本原理及在孤立词识别中的应用,并且实现了一个文本有关的孤立词识别系统,其正确识别率达到96.3%。  相似文献   

4.
谢锦辉 《通信学报》1994,15(2):83-87
本文简要讨论了在基于HMM的连续语音识别系统中怎样选取基本语音单元的问题,介绍了在欧洲Polyglot课题下在法国LINSI-CNRS建立的基于上下文无关音素HMM。然后,本文详细给出了利用左或右上下文相关音素HMM,作者对上述系统改进后进行的连续语音识别,有用美国语音库DARPA-RM1,在不考虑句法信息时,我们获得了连续时词识别率大约3-10个百分点的明显提高。实验是在法国LIMSI-CNRS  相似文献   

5.
语音识别是人机语音通信的关键技术之一,也是难题之一.介绍了一种语音识别系统,主要介绍了该系统的语音处理流程,阐述了系统使用Mel频标倒谱参数作为特征提取的方法,采用隐马尔科夫模型算法的测度估计技术.通过严格测试,该系统达到实用化要求.该语音识别系统较好的实现了在移动电子设备上资源有限条件下方便快捷的汉字语音输入,具有重大现实意义.  相似文献   

6.
从线性预测HMM到一种新的语音识别的混合模型   总被引:1,自引:0,他引:1       下载免费PDF全文
欧智坚  王作英 《电子学报》2002,30(9):1313-1316
线性预测HMM(Linear Prediction HMM,LPHMM)并没有象传统HMM那样引入状态输出独立同分布假设,但实用中识别性能并不佳.通过分析两种HMM的各自优劣,本文提出了一种新的语音识别的混合模型,将语音静态特性(基于传统HMM)和动态特性(基于LPHMM)分别描述又有机结合在一起,更为精确地刻划了真实的语音现象,同时又继承使系统的实现改动很小和较小的计算量.汉语大词汇量非特定人连续语音识别的实验表明,混合模型的识别性能显著好于LPHMM和传统HMM.理论上,本文还给出了LPHMM的一组闭式参数重估公式.  相似文献   

7.
基于连续HMM的孤立语音鲁棒性识别方法   总被引:5,自引:1,他引:5  
对于基于连续稳马尔可夫模的语音识别系统,为了提高系统在环境噪声下的鲁棒性,本文提出了一种能有效抑制加性平稳噪声和通道卷积噪声的相对自相关序列的Mel倒谱参数(RAS_MFCC+△RAS_MFCC),进行特征参数级的去噪,明显地改善了系统的噪声鲁棒性。  相似文献   

8.
DWT based HMM for face recognition   总被引:1,自引:0,他引:1  
A novel Discrete Wavelet Transform (DWT) based Hidden Markov Module (HMM) for face recognition is presented in this letter. To improve the accuracy of HMM based face recognition algorithm, DWT is used to replace Discrete Cosine Transform (DCT) for observation sequence ex- traction. Extensive experiments are conducted on two public databases and the results show that the proposed method can improve the accuracy significantly, especially when the face database is large and only few training images are available.  相似文献   

9.
马帅  高岳  何翔宇 《电子质量》2011,(4):17-18,21
HMM模型(隐含马尔科夫模型)由于对时间序列结构具有较强的建模能力.而逐步成为主流的语音识别技术.该文首先深入浅出地概述了基于HMM的语音识别技术,然后介绍了三个基本问题,最后在MATLAB下实现了孤立词语音识别系统.  相似文献   

10.
The co-articulation is one of the main reasons that makes the speech recognition difficult. However, the traditional Hidden Markov Models(HMM) can not model the co-articulation, because they depend on the first-order assumption. In this paper, for modeling the co-articulation, a more perfect HMM than traditional first order HMM is proposed on the basis of the authors' previous works(1997, 1998) and they give a method in that this HMM is used in continuous speech recognition by means of multilayer perceptrons(MLP), i.e. the hybrid HMM/MLP method with triple MLP structure. The experimental result shows that this new hybrid HMM/MLP method decreases error rate in comparison with authors' previous works.  相似文献   

11.
非接触式手势控制交互识别作为一种人机交互的新型技术,摆脱了传统的人机设备限制,更符合人际交流习惯。从其实现原理来看,非接触式手势控制交互识别有多种实现,有基于摄像头的识别,也有基于体感遥控的手势识别。本文采用了基于红外传感器的动态手势识别,其基本实现原理是利用四个定向二极管来感知反射的红外线能量,然后将该数据转换为四个方向的距离信息。对于如何从距离信息识别手势,一般多采用动态时间规整、人工神经网络以及隐马尔可夫模型(HMM, Hidden Markov Model)等模式匹配算法。HMM是一种随时间变化的信号模型,具有自动分割和分类能力,适合进行动态手势识别。本文通过HMM对传感器输出的四个方向距离信息进行训练识别,经过多次试验及调整,使得对于5种手势的识别率平均都达到了75%以上,并且随着手势训练数据的增加,识别率会随之提高。  相似文献   

12.
关键词检出(keywordspottin)g也称词检出(wordspottin)g,是近年来语音识别中颇受重视的研究领域,可广泛应用于电话的自动接听和对话监听、语音的录入和检索等方面。文中首先介绍了关键词检出的HMM方案及其研究成果,并对其进行了仿真实验,最后指出了关键词检出尚待解决的一些问题及研究方向。  相似文献   

13.
基于3维空间Viterbi算法的汉语连续语音识别方法   总被引:1,自引:0,他引:1       下载免费PDF全文
赵力  邹采荣  吴镇扬 《电子学报》2000,28(7):67-69,58
本文提出了基于3维空间Viterbi算法的汉语连续语音识别方法。本方法采用60个音素单位的隐马尔可大模型(HMM)和8个声调单位的HMM作为识别用基元模型。音素基元模型和声调基元模型的识别结果的统合,采用音素单位的HMM状态,声调单位的HMM状态和时间的3维空间Viterbi算法来实现。  相似文献   

14.
实际的研究表明,语音情感识别方法有多种.介绍了一种基于GMM的语音情感识别方法,包括该方法的优点、存在的问题或不足等,并对此进行了思考,给出了一些处理办法.  相似文献   

15.
语音情感识别的研究进展   总被引:11,自引:0,他引:11  
情感在人类的感知、决策等过程扮演着重要角色.长期以来情感智能研究只存在于心理学和认知科学领域,近年来随着人工智能的发展,情感智能跟计算机技术结合产生了情感计算这一研究课题,这将大大的促进计算机技术的发展.情感自动识别是通向情感计算的第一步.语音作为人类最重要的交流媒介,携带着丰富的情感信息.如何从语音中自动识别说话者的情感状态近年来受到各领域研究者的广泛关注.本文从语音情感识别所涉及的几个重要问题出发,包括情感理论及情感分类、情感语音数据库、语音中的情感特征和语音情感识别算法等,介绍了当前的研究进展,并讨论了今后研究的几个关键问题.  相似文献   

16.
随着现代科技和计算机以及平板电脑等的发展,语音交互将成为人机通信的主要方式,而汉语在语音合成中声调是不可或缺的一个重要组成部分。在声调提取过程中首先采用改进的短时自相关函数的方法进行基音检测,同时为了能较为精确地进行浊音的基音检测,利用变长分帧的方法提取基音周期序列,并通过Matlab仿真得到了汉语语音4种声调的调型曲线。仿真结果表明,该方法所得到的调型曲线与汉语普通话声调的典型曲线较为一致。  相似文献   

17.
基于CNN的连续语音说话人声纹识别   总被引:1,自引:0,他引:1  
近年来,随着社会生活水平的不断提高,人们对机器智能人声识别的要求越来越高.高斯混合—隐马尔可夫模型(Gaussian of mixture-hidden Markov model,GMM-HMM)是说话人识别研究领域中最重要的模型.由于该模型对大语音数据的建模能力不是很好,对噪声的顽健性也比较差,模型的发展遇到了瓶颈.为了解决该问题,研究者开始关注深度学习技术.引入了CNN深度学习模型研究连续语音说话人识别问题,并提出了CNN连续说话人识别(continuous speaker recognition of convolutional neural network,CSR-CNN)算法.模型提取固定长度、符合语序的语音片段,形成时间线上的有序语谱图,通过CNN提取特征序列,经过奖惩函数对特征序列组合进行连续测量.实验结果表明,CSR-CNN算法在连续—片段说话人识别领域取得了比GMM-HMM更好的识别效果.  相似文献   

18.
为了提高自发性口语语音识别率及语音解码识别效率,提出了一种新的自发性语音识别方案。实验结果表明,该识别方案不仅能提高语音识别率,而且还能有效准确地切分音频,提高评测系统的解码效率,鲁棒性较强。  相似文献   

19.
当下,地震应急救援时使用对讲机通话是必不可少的通信方式。但救援人员通话时,必然要用手按住PTT才行,这就影响救援人员工作时便利性。基于此,研究采用最新数字运算处理技术以及编入了只识别人类声音的算法,使得外界声音和冲击等不被识别。当救援人员讲话时,自动识别产生PTT,就可以实现通话。救援人员的双手给彻底解放出来,讲话时对讲机自动发射,这对于通信方法优化,提高救援效率,都是有重大益处的。  相似文献   

20.
随着计算机技术的发展,人们对和谐人机交互的要求不断提高,这就要求计算机能理解说话人的情感信息,即能进行语音情感识别。本文提出了一种基于支持向量机(SVM)的语音情感识别方法,主要对人类的6种基本情感:高兴、惊奇、愤怒、悲伤、恐惧、平静进行研究。首先对自建语音情感数据库的情感语句提取特征,然后运用序列前向选择(SFS)算...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号