首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
随着计算机技术的不断发展和信息技术的不断进步,各类智能机器也逐步进入到人们的生活中.语音识别是一种前景广阔、社会效益广泛、经济效益明显的技术,在快速发展的同时也不可避免地产生了一些问题.本文主要针对基于HMM和神经网络的语音识别系统进行了细致的分析,期待能对我国语音识别系统的研究和实践提供有效的借鉴和参考.  相似文献   

2.
基于循环神经网络的语音识别模型   总被引:4,自引:1,他引:4  
朱小燕  王昱  徐伟 《计算机学报》2001,24(2):213-218
近年来基于隐马尔可夫模型(HMM)的语音识别技术得到了很大发展。然而HMM模型有着一定的局限性,如何克服HMM的一阶假设和独立性假设带来的问题一直是研究讨论的热点,在语音识别中引入神经网络的方法是克服HMM局限性的一条途径。该文将循环神经网络应用于汉语语音识别,修改了原网络模型并提出了相应的训练方法,实验结果表明该模型具有良好的连续信号处理性能,与传统的HMM模型效果相当,新的训练策略能够在提高训练速度的同时,使得模型分类性能有明显提高。  相似文献   

3.
基于HMM与RBF的混合语音识别新方法   总被引:5,自引:0,他引:5  
提出了一种隐马尔可夫模型(HMM)和径向基函数神经网络(RBF)相结合的语音识别新方法。该方法首先利用HMM生成最佳语音状态序列,然后用函数逼近技术产生对最佳状态序列进行时间规正,最后通过RBF神经网络进行分类识别。理论和实验结果表明,该系统比HMM具有更好的识别效果,特别对提高易混淆词的识别性能尤为显著。  相似文献   

4.
为了解决语音信号中帧与帧之间的重叠,提高语音信号的自适应能力,本文提出基于隐马尔可夫(HMM)与遗传算法神经网络改进的语音识别系统.该改进方法主要利用小波神经网络对Mel频率倒谱系数(MFCC)进行训练,然后利用HMM对语音信号进行时序建模,计算出语音对HMM的输出概率的评分,结果作为遗传神经网络的输入,即得语音的分类识别信息.实验结果表明,改进的语音识别系统比单纯的HMM有更好的噪声鲁棒性,提高了语音识别系统的性能.  相似文献   

5.
左琳  陈鑫铎 《福建电脑》2005,(12):27-28,35
本文主要介绍了HMM与自组织神经网络结合的语音识别方法的模型及其算法。并且在该模型和算法的基础上,通过试验。对比了HMMNN模型和CDHMM模型在特定人语音识别和非特定人语音识别两个方面的识别效果,验证了HMMNN模型的优越性。最后分析了HMMNN的识别优越性从何而来。  相似文献   

6.
针对经典隐马尔可夫模型对状态持续时间的函数表达与实际语音的物理事实不相符合这一缺点,在通常隐马尔可夫的基础上引入状态持续时间参数,建立基于状态持续时间的HMM语音识别模型(SDHMM),并用其进行语音识别实验,与经典隐马尔可夫模型相比,识别率有所提高。  相似文献   

7.
语音识别是人工智能最基础性课题,该课题研究者通过对隐马尔可夫模型这一数学模型的扩领域应用,解决了声学、语言学、句法等统计知识相关性问题。文章系统阐述了隐马尔可夫模型原理以及在语音识别中的应用过程,从而为更多研究者了解和认识。  相似文献   

8.
论文在语音信号分析的理论基础上,研究了基于模型补偿的识别算法,对比了语音识别最常用的两种算法:动态时间归整算法(DTW)和隐马尔可夫算法(HMM),并针对两种算法的不足进行了改进。基于改进后的算法在MATLAB环境下搭建了孤立词语音识别系统,提高了识别率,节省了运行时间。  相似文献   

9.
基于HMM建模技术的语音识别改进算法   总被引:1,自引:0,他引:1  
本文在隐马尔可夫模型(Hidden Markov Model,简称HMM)的基础上,提出了一种帧相关模型的改进算法,它与现行HMM方法中的前后帧相关模型比,算法简化,计算量明显减小,与传统HMM方法比,提高了识别率  相似文献   

10.
基于HMM和遗传神经网络的语音识别系统   总被引:1,自引:0,他引:1  
本文提出了一种基于隐马尔可夫(HMM)和遗传算法优化的反向传播网络(GA-BP)的混合模型语音识别方法。该方法首先利用HMM对语音信号进行时序建模,并计算出语音对HMM的输出概率的评分,将得到的概率评分作为优化后反向传播网络的输入,得到分类识别信息,最后根据混合模型的识别算法作出识别决策。通过Matlab软件对已有的样本数据进行训练和测试。仿真结果表明,由于设计充分利用了HMM时间建模能力强和GA-BP神经网络分类能力强等特点,该混合模型比单纯的HMM具有更强的抗噪性,克服了神经网络的局部最优问题,大大提高了识别的速度,明显改善了语音识别系统的性能。  相似文献   

11.
维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolKit)工具实现了基于隐马尔可夫模型(HMM)的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了维吾尔语连续语音识别实验。  相似文献   

12.
在分析语音识别原理的基础上采用TMS320DM642 DPS芯片,利用前向-后向HMM声学模型和Viterbi算法进行模式训练和识别,设计了一种连续的、小词量的语音识别系统.实验结果表明,该语音识别系统具有较高的识别率和一定程度的鲁棒性,实验室识别率和室外识别率分别达到96.8%及91.2%,该语音识别系统具有良好的实用性和可移植性.  相似文献   

13.
14.
Automatic speech recognition is a technology that allows a computer to transcribe in real time spoken words into readable text. In this work an HMM automatic speech recognition system was created to detect smoker speaker. This research project is carried out using Amazigh language for comparison of the voice of normal persons to smokers one. To achieve this goal, two experiments were performed, the first one to test the performance of the system for non-smokers for different parameters. The second experiment concern smokers speakers. The corpus used in this system is collected from two groups of speaker, non-smokers and smokers native Morocan tarifit speakers aged between 25 and 55 years. Our experimental results show that we can use our system to make diagnostic for smoking people and confirm that a speaker is smoker when the observed recognition rate is below 50%.  相似文献   

15.
对于具有大量特征数据和复杂发音变化的英语语音,与单词相比,在隐马尔可夫模型(HMM)中存在更多问题,例如维特比算法的复杂度计算和高斯混合模型中的概率分布问题。为了实现基于HMM和聚类的独立于说话人的英语语音识别系统,提出了用于降低语音特征参数维数的分段均值算法、聚类交叉分组算法和HMM分组算法的组合形式。实验结果表明,与单个HMM模型相比,该算法不仅提高了英语语音的识别率近3%,而且提高系统的识别速度20.1%。  相似文献   

16.
为了优化语音特征提取方法,文中提出了一种称为MFCC_P的语音特征提取方法。对于语音识别来说,如何提取语音的特征向量至关重要。但是,现有的算法在去除噪声时也同时损坏了声音信号。MFCC_P在Mel滤波器上下工夫,使得滤波器组整齐排列,没有重叠,噪声被有效消除。  相似文献   

17.
基于LM算法的神经网络语音识别   总被引:2,自引:0,他引:2  
葛玲  贾志成  夏克文  王霞 《计算机工程与设计》2006,27(14):2534-2536,2539
由于语音识别中朵用标准BP算法存在的训练速度慢、容易陷入局部极小等问题,提出一种基于稳定、快速的Levenberg-Marquardt算法的神经网络语音识别方法,主要包括语音信号预处理、特征提取、网络结构优化设计、网络学习训练和语音识别等过程。其中网络隐含层节点数的选取采用黄金分割优选法。试验仿真表明,LM算法明显提高了网络训练速度,减少了训练时间,其效果优越于标准BP算法。  相似文献   

18.
改进的混合MFCC语音识别算法研究   总被引:3,自引:0,他引:3       下载免费PDF全文
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。  相似文献   

19.
汽车司机疲劳驾驶是引发交通事故的一个重要原因。驾驶员在正常驾驶、瞌睡驾驶及疲劳驾驶3种状态下的眼睛张开程度有一定的区别。提出了一种ICA结合隐马尔可夫模型(HMM)识别眼部状态的识别算法,首先对彩色图像进行二值化处理,然后利用ICA算法进行眼部状态特征提取,为了加快特征提取的速度,这里采用FastICA算法;然后通过HMM进行眼部状态识别。实验结果表明,该算法可快速有效地识别出驾驶员眼部状态。  相似文献   

20.
通过分布式语音识别DSR的研究,提出了基于FPGA平台的前端处理系统结构。对其中两个除法器分别采用了LUT查找表和常数除法器的结构。用VerilogHDL语言进行建模仿真,并与Matlab的建模结果进行了对比。结果表明,与之前的方法相比,系统能够在较短的时钟周期内计算出LPCC系数,节省了大量的运算时间和一定的面积。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号