首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于傅立叶描述子和HMM的手势识别   总被引:1,自引:0,他引:1  
陈启军  朱振娇  顾爽 《控制工程》2012,19(4):634-638
针对家庭服务机器人平台中人机交互的问题,提出基于视觉的手势识别作为人与机器人交互的方式,研究利用傅立叶描述子对手势形状进行描述,并结合支持向量机和隐马尔可夫模型分别对静态手势和动态手势进行分类,实现了静态手势和动态手势的识别。该系统基于新型传感器Kinect,在图像分割阶段结合图像深度信息,可以有效的将手势区域提取出来,在一定范围内具有较强的鲁棒性,特征提取阶段基于傅立叶描述子,使手势识别具有旋转、缩放、平移不变性。针对七种常见静态手势和四种动态手势进行测试,平均识别率分别达到98.8%和96.7%,实验结果表明该系统具有较高的准确度。  相似文献   

2.
基于动态MFCC的说话人识别算法   总被引:1,自引:0,他引:1  
提出了一种基于动态MFCC特征的说话人识别算法.该算法根据说话人的基音频率随语境变化的特点,通过动态构建基于说话人基音频率的Mel-滤波器组,以抽取可以表征说话人身份特征的动态MFCC参数,提高说话人辨识的准确性和鲁棒性.此外,本文还讨论了基于高斯混合模型的分类器设计问题,给出了一个通过聚类分析获得高斯混合模型的最优混合度与相关模型参数的初始估计的方法.实验证明,本文所提出的方法在实际中能够获得较好的识别结果.  相似文献   

3.
针对MFCC不能得到高效的说话人识别性能的问题,提出了将时频特征与MFCC相结合的说话人特征提取方法。首先得到语音信号的时频分布,然后将时频域转换到频域再提取MFCC+MFCC作为特征参数,最后通过支持向量机来进行说话人识别研究。仿真实验比较了MFCC、MFCC+MFCC分别作为特征参数时语音信号与各种时频分布的识别性能,结果表明基于CWD分布的MFCC和MFCC的识别率可提高到95.7%。  相似文献   

4.
基于HMM的说话人识别中下溢问题的修正   总被引:1,自引:1,他引:1  
刘云冰 《微计算机信息》2006,22(14):293-294
基于隐马尔可夫模型构造说话人识别系统,涉及到评估、识别、训练三个基本问题,相应地采用前-后向算法、Viterbi算法、Baum-Welch算法来进行编程实现。在实现过程中,发现和的下溢问题,提出了采取增加比例因子对其加以修正的方法。  相似文献   

5.
现代通信中,说话人的身份认证技术一直是通信行业研究的重点和热点。而基于GMM和MFCC的说话人识别技术,是目前为止相对成熟和常用的方法。对说话人识别系统的构成做了相关的研究,并通过MATLAB编程,设计了一款以MFCC作为特征参数,基于GMM模型的说话人识别系统。经过实验测试,本系统能基本满足工作及家庭生活环境下的说话人识别需要。  相似文献   

6.
给出一种以隐马尔可夫(HMM)模型为基础的离线签名的识别方法,此方法把离线签名图像中的所有汉字作为一个整体,首先利用图像处理技术,把整个字体区域分割出来,再统计每一行字体部分的像素点数。利用隐马尔可夫模型来对这个整体进行建模;然后利用Baum-Welch算法对模型进行训练;最后,利用已经训练好的HMM模型对一些签名图片进行识别。试验表明,识别率可达95.7%,为离线签名识别系统的进一步应用奠定了基础。  相似文献   

7.
基于音频信号的轴承故障诊断方法   总被引:1,自引:0,他引:1  
介绍了一种基于隐马尔可夫模型的轴承故障音频信号诊断方法。通过对轴承音频信号的 Mel 频率倒谱系数特征提取,分别采用离散 HMM 和连续高斯混合密度 HMM 两种方法进行建模与诊断研究。与 CGHMM 方法相比,DHMM 方法运算速度快,但诊断精度低。而从总体上来看,两种方法都具有运算速度快,诊断精度高的优点。结果表明,本文方法具有很好的应用前景。  相似文献   

8.
针对嵌入式系统语音识别执行速度太慢的问题,对梅尔频率倒谱参数和隐马尔可夫模型各步骤作详细研究,提出了在嵌入式系统中进行整数运算和查表算法,实现语音识别加速的方法.加速前后执行速度对比实验显示,在特征提取部分,加速约有20倍.  相似文献   

9.
为了提高语音识别的鲁棒性,提出一种新的特征组合方法。方法基于F比对梅尔频率倒谱系数(MFCC)进行加权优化,同时将不同特征组合输入到语音隐马尔科夫模型(HMM)进行训练,得到具有抗噪性的最佳组合,并采用主成分分析(PCA)进行降维,增加支持向量机(SVM)分类器作为后处理器。实验表明,改进的MFCC、短时平均能量和Teager能量算子组合参数识别效果最优,识别率达到90. 48%。PCA降维后识别率降低了0. 4%,提升了计算速度。增加后处理器,系统识别率达到95. 25%,提高了系统的识别效率和分类决策力,相对于常规识别方法,准确率有所提高。  相似文献   

10.
针对普通话测试中噪音干扰问题,提出了一种基于小波变换的普通话智能测试系统,对噪音环境下的语音信号进行准确辨别。为了确保本文系统语音识别的准确率,通过隐马尔可夫统计模型叠加神经网络,采用模式匹配的方式搭建了整体语音辨别系统。为了降低噪音对语音信号的影响,在系统中引入小波分析对信号进行去噪处理,同时引入了梅尔频率倒谱系数提取信号特征。实验证明,相较于未改进的传统系统,基于小波变换改进的普通话智能测试系统,在有噪声环境下,四次仿真的平均识别准确率要高7.2%,平均识别时间缩短了1.1 s,识别效果大幅提高;相较于基于DNN的普通话识别系统和基于CTC准则的普通话识别系统,基于小波变换改进的普通话智能系统,在4种不同噪音环境下,语音识别准确率更高,尤其面对频谱更集中的噪音,系统的识别准确率高达90.7%,分别较另外两种系统高出7.5%和6.6%,具有更好的实用性。  相似文献   

11.
许琳  王作英 《计算机工程》2004,30(10):135-136,142
音乐识别的研究早在20世纪70年代就开始了,但直到最近,识别系统的性能仍不令人满意。该文提出了利用HMM进行音乐识别的新思路。给出了基本的算法框架,并对相关的问题进行了讨论。  相似文献   

12.
基于乘积HMM的双模态语音识别方法   总被引:3,自引:2,他引:1       下载免费PDF全文
针对噪声环境中的语音识别,提出一种用于双模态语音识别的乘积隐马尔可夫模型(HMM)。在独立训练音频HMM和视频HMM的基础上,建立二维训练模型,表征音频流和视频流之间的异步特性。引入权重系数,根据不同噪声环境自适应调整音频流与视频流的权重。实验结果证明,与其他双模态语音识别方法相比,该方法的识别性能更高。  相似文献   

13.
讨论一种基于HMM(隐马尔可夫模型)的英文印刷体识别方法。先将整篇文本图像切分成字母级别,提取出字母轮廓的8方向特征,之后把特征向量进行矢量量化并送入HMM训练识别。根据切分中出现的错误特点,对矢量量化过程和训练算法提出一些改进方法,提高识别率。  相似文献   

14.
MATLAB环境下的基于HMM模型的语音识别系统   总被引:5,自引:0,他引:5  
在MATLAB环境下利用语音工具箱Voice Box实现基于连续概率密度隐含马尔科夫模型的汉语语音识别系统。在实时录音的情况下,利用该语音识别系统,不同的人对20条2~8个字的语音命令进行识别,准确率可达到95%,识别时间1.5~3s,实现了小词汇量连续语音的非特定人的实时识别。  相似文献   

15.
针对信号识别率高低由识别模型及特征参数决定的特点,提出融合K均值聚类的多观察序列的Baum-Welch参数重估算法,用于训练隐马尔科夫模型(HMM),通过主分量分析(PCA)对梅尔频率倒谱系数进行变换,并设计与实现一套基于PCA和HMM的心音自动识别系统.实验结果表明,该系统对6类常见心音的平均识别率达到83.3%,性能优于其他心音识别系统.  相似文献   

16.
基于连续隐马尔可夫模型的步态识别   总被引:4,自引:0,他引:4       下载免费PDF全文
步态识别作为一种新的生物特征识别技术,通过人走路的姿势实现对个人身份的识别和认证.算法利用步态轮廓图像边界到重心的距离矢量对步态轮廓图像进行描述,采用步态图像的高宽比进行步态的准周期性分析.利用隐马尔可夫模型进行步态时变数据匹配识别.算法在CMU数据库上进行实验取得了较高的正确识别率.  相似文献   

17.
针对智能监控系统中的行为分析与识别,将隐马尔可夫模型(Hidden Markov model,HMM)应用到智能视频监控系统的异常事件检测中。首先应用背景差法将运动目标提取出来。其次将运动目标的形状、颜色和帧间变化度等特征编码,生成特征向量。训 练时将特征向量送入HMM训练得到隐马尔可夫模型需要的参数[WTHX]A和B[WTBZ],检测时将特征向量送入HMM检测系统检测是否有异常事件发生。最后的实验结果表明,该方法能快速有效地检测监控视频中的异常事件的发生。  相似文献   

18.
陈燕龙  钟碧良 《计算机工程》2008,34(13):190-192
提出基于微粒群优化算法(PSO)的隐马尔科夫模型(HMM)训练算法,分别用PSO和量子微粒群优化算法进行HMM的参数估计,以提高HMM的性能。将改进的HMM算法应用于人脸表情识别,采用离散余弦变换提取表情特征向量。实验结果表明,该算法能有效提高表情识别率,解决HMM的参数估计问题。  相似文献   

19.
利用MATLAB软件,设计了一种基于GMM模型的与文本无关的说话人辨认系统。该系统包括语音活动检测、提取MFCC参数、训练GMM参数和判决辨认四部分。经过TIMIT数据库测试,该系统的性能良好。  相似文献   

20.
基于HMM的汉语文本识别后处理研究   总被引:9,自引:1,他引:8  
本文用HMM(Hidden Markov Model)描述汉语文本识别后处理,将汉语语言和单字识别这两个概率模型结合起来,以充分利用单字识别器提供的信息。语言模型的参数由语料库统计得到;单字识别模型的参数为条件概率,经理论分析,它可转化为后验概率来求解。在分析训练样本集单字识别结果的基础上,提出一种统计方法估计候选字的后验概率。HMM在脱机手写体汉语文本识别中的实验表明,后处理性能除取决于语言模型外,还取决于后验概率的精确估计。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号