首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
本文讨论了最大模型距离准则,对原有最大模型距离准则函数做了合理的修正,并把它应用于隐马尔可夫模型的训练,重新推导了HMM的迭代公式,使得训练后的HMM具有更好的鉴别能力。把这种改进的HMM训练算法应用于面部表情识别,利用本文给出的改进光流算法提取面部表情特征向量序列,构建了基于改进的HMM算法和BP神经网络的面部表情混合分类器,通过实验表明识别率得到有效提高。  相似文献   

2.
讨论一种基于HMM(隐马尔可夫模型)的英文印刷体识别方法。先将整篇文本图像切分成字母级别,提取出字母轮廓的8方向特征,之后把特征向量进行矢量量化并送入HMM训练识别。根据切分中出现的错误特点,对矢量量化过程和训练算法提出一些改进方法,提高识别率。  相似文献   

3.
《微型机与应用》2018,(1):106-110
提出了基于奇异值分解(Singular Value Decomposition,SVD)特征矩阵压缩和隐Markov模型(Hidden Markov Model,HMM)的动态手势识别方法。该方法通过SVD对特征矩阵进行时间维度的压缩,然后通过HMM的方法对提取的动态手势进行识别。通过对特征矩阵压缩可以显著地减少训练HMM的迭代计算量,提高模型的训练效率。采用Leap Motion体感控制器追踪并提取自定义的10个阿拉伯数字的动态手势特征。实验验证结果表明,该方法对这些动态手势在当前有限样本条件下的总识别率均在96%以上。  相似文献   

4.
当对HMM(Hidden Markov Model,隐马尔科夫模型)语音模型进行GMM(Gaussian Mixture Model,混合高斯模型)区分训练增加组件时,语音模型的识别率会随着GMM的组件增多而增加,模型的大小也会增加,这就造成了语音模型的臃肿。而在移动端使用本地语音模型进行识别时,存放一个几百兆的模型很不合适。针对上述问题,本文提出将一个GMM组件数较多的语音模型利用BIC准则压缩到指定的组件数,从而在模型大小合适的情况下尽量保证模型的识别率。实验结果表明,使用本方法进行压缩之后的语音识别率比未压缩的相同组件数的语音识别模型的识别率要高。  相似文献   

5.
基于MFCC和双重GMM的鸟类识别方法   总被引:1,自引:0,他引:1  
针对鸟类鸣声信号变化丰富和复杂的特点,提出一种基于MFCC和鸣叫、鸣唱声GMM模型的鸟类识别方法。该方法拟采用将鸟鸣声分为鸟叫声和鸟唱声的策略,分别提取其特征参数MFCC,提出双重GMM模型进行训练和识别。用8种鸟的鸣叫声和鸣唱声1077个样本进行实验,实验结果表明,双重GMM模型的识别率达到90%以上,与单一鸣声模型相比具有更高的识别率。  相似文献   

6.
短时声学特征参数如MFCC,PLP作为输入向量的高斯混合模型(GMM)的隐马尔可夫模型(HMM)的经典模型在大词汇连续语音识别系统(LVCSR)已取得了良好识别效果。但针对短时声学特征区分性差的特点,本文提出采用神经网络多层感知器(MLP)产生的两种类型差异特征HATs与TANDEM代替短时特征,分别训练GMM参数模型。实验结果表明,差异特征的GMHMM的LVCSR系统优于传统的短时特征的系统;为了更进一步提高系统识别率,该文又将两种类型差异特征HATs与TANDEM进行复合,构成MLPs特征流重建GMHMM,系统的错字率(CER)有2%~3.8%的明显改善。  相似文献   

7.
针对传统隐马尔可夫模型(HMM)在识别对象时没有有效利用所识别对象的结构信息,提出了一种基于原图像分块的HMM。这种模型利用原图像的各个分块作为状态,因此具有相应的拓扑结构,可以为所识别对象的结构信息建模。为了增强模型的描述能力与精确性,采用二阶HMM,引入了终止状态,将其应用在手写数字识别中。考虑到手写数字的结构特点与模型的拓扑结构,提出了一种提取手写数字笔画特征的方法,即根据叉点提取各个笔段的特征向量。对MNIST字库进行测试,平均识别率为95.7%。  相似文献   

8.
为了实现生物膜法污水处理的故障诊断,提出了基于隐马尔可夫模型(HMM)的专家系统方法。该方法对HMM的训练采用了Baum-Welch算法,并对迭代次数、识别率以及与专家系统的结合方式等进行了研究。结果可以看出HMM的迭代次数都在30步以内,故障识别率均在98%以上,基于HMM专家系统用于生物膜法污水处理的故障诊断具有较好的稳定性和较高的识别率,且系统结构简单,易于实现。  相似文献   

9.
许允喜  陈方 《计算机应用》2008,28(6):1546-1548
为了解决传统高斯混合模型(GMM)对初值敏感,在实际训练中极易得到局部最优参数的问题,提出了一种采用微粒群算法优化GMM参数的新方法。该方法将最大似然估计融入到微粒群算法迭代过程中,形成了新的混合算法。它利用微粒群算法的全局优化性及最大似然估计的局部寻优性求解高斯混合模型的参数,以提高参数精度。说话人辨认实验表明,与传统的方法相比,新方法可以得到更优的模型参数,使得系统的识别率进一步提高。  相似文献   

10.
基于HMM的联机汉字识别系统及其改进的训练方法   总被引:5,自引:1,他引:4  
本文描述了一个基于HMM模型的联机汉字识别系统的设计思想与实现方法。系统以联机汉字的笔段序列作为观察序列,采用带有多跨越的模型结构消除自由书写汉字笔段序列的冗余与丢失问题。HMM模型的训练是本系统设计的一个重要问题,针对复杂HMM模型参数训练容易收敛于局部最小的情况,本文结合联机汉字识别的特点,提出了一种利用“引导模型”进行训练的改进方法,避免了训练过程收敛于局部最小点的发生。经过大量样本的训练,本系统对规范书写汉字和自由书写汉字均取得了比较令人满意的结果。  相似文献   

11.
为了探讨高斯混合模型在说话人识别中的作用,设计了一个基于GMM的说话人识别系统。整个系统由音频信号预处理,语音活动检测,说话人模型建立以及音频信号识别4个模块组成。前三个模块构成了系统的模型训练部分,最后一个模块构成了系统的语音识别部分。包含在第二个模块中的由GMM模型搭建的语音活动检测器是研究的创新之处。利用增强的多方互动会议语料库中的视听会议对系统中的部分可调参数以及系统的识别错误率进行了测试。仿真结果表明,在语音活动检测器和若干滤波算法的帮助下,系统对包含重叠语音的音频信号的识别准确率可以达到83.02%。  相似文献   

12.
语音识别赋予了计算机能够识别出语音内容的功能,是人机交互技术领域的重要研究内容。随着计算机技术的发展,语音识别已经得到了成熟的发展。但是关于方言的语音识别还有很大的发展空间。中国是一个幅员辽阔、人口众多的国家,因此方言种类繁多,其中有3000多万人交流使用的重庆方言就是其中之一。采集了重庆方言的部分词语的文本文件和对应的语音文件建立语料库,根据重庆方言的发音特点,选取重庆方言的声韵母作为声学建模基元,选取隐马尔可夫模型(Hidden Markov Model, HMM)为声学模型设计了一个基于HMM的重庆方言语音识别系统。在训练过程利用语料库中训练集语料对声学模型进行训练,形成HMM模型库;在识别过程利用语料库中的测试集语料进行识别测试。实验结果表明,该系统能够实现重庆方言的语音识别,并且识别的正确率为100%。  相似文献   

13.
张志平  汪庆淼 《计算机工程》2010,36(23):139-141,145
根据隐马尔可夫模型(HMM)适用于处理连续动态序列信号、支持向量机(SVM)与K近邻分类器(KNN)擅长模式分类的特点,设计一种(HMM+KNN)+SVM的混合分类器。利用HMM与KNN对测试样本进行判决。当判决结果相同时,直接输出判决结果,否则引入SVM对测试样本进行再判决。实验结果表明,该方法所确定的分类器优于单一的分类器判决,能有效实现表情识别。  相似文献   

14.
提出了从复杂背景视频图像中提取文字并识别的一套算法,利用自适应迭代算法提取视频中维吾尔文字,针对维吾尔文字的一些特点,利用合适的预处理方法保留维吾尔文字中的各种点及特殊笔画,同时有效地消除了复杂背景带来的噪声。考虑维吾尔文字书写的特点,利用滑动窗口法提取文字特征避免了文字分割,将产生的特征向量输入到隐马尔可夫模型(Hidden Morkov Model)中进行训练和识别。  相似文献   

15.
基于深度学习的端到端语音识别模型中,由于模型的输入采用固定长度的语音帧,造成时域信息和部分高频信息损失进而导致识别率不高、鲁棒性差等问题。针对上述问题,提出了一种基于残差网络与双向长短时记忆网络相结合的模型,该模型采用语谱图作为输入,同时在残差网络中设计并行卷积层,提取不同尺度的特征,然后进行特征融合,最后采用连接时序分类方法进行分类,实现一个端到端的语音识别模型。实验结果表明,该模型在Aishell-1语音集上字错误率相较于传统端到端模型的WER下降2.52%,且鲁棒性较好。  相似文献   

16.
为了简化系统模型训练方法,提高性别识别系统的整体效率,提出了一种基于改进Citation-KNN算法的说话人性别识别方法。该方法将连续语音切分,训练每段语音的高斯混合模型(Gaussian Mixture Model,GMM)作为多示例包,其所有混合元为相应包中示例;采用改进的Hausdorff距离作为包与包之间的距离测度,通过Citation-KNN算法进行性别识别。该方法以多示例包间距离为分类依据,简化了系统训练,且识别率优于一些传统算法。  相似文献   

17.
曾斌  姚路  陈志诚 《计算机工程》2011,37(15):149-151,167
设计一个基于声纹识别的Web身份认证系统。在浏览器端利用自主开发的ActiveX录音控件录取封装使用者的声纹特征并传送给服务器,服务器端使用隐马尔科夫模型表述单字,单字之间通过增加静音状态分割以及语音训练形成稳定的声纹特征模型作为身份验证的基础库。实际测试结果表明,该系统识别性能好、可移植性强,适用于网络资源的远程声控。  相似文献   

18.
陈黎  徐东平 《计算机工程》2011,37(14):172-174
建立一种支持向量机-高斯混合模型(SVM-GMM),用以提高开集说话人识别的识别率。该模型的基本思想是将SVM的分类结果用GMM模型进行确认。由于SVM模型具有较好的分类性能,而GMM模型能够较好地描述类别内部的相似性,因此这2个模型的组合能够优势互补,从而获得较好的识别效果。实验结果表明,使用SVM-GMM模型能有效地提高开集说话人识别的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号