首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
引入帧跳跃的概念,从而改进了传统的端点检测算法和DTW算法,实现了一个改进的实时语音识别系统,并在计算机上进行了模拟仿真。实验结果表明,改进后的算法能有效提高孤立词的识别速度和识别精度。  相似文献   

2.
语音识别中DTW改进算法的研究   总被引:1,自引:0,他引:1  
动态时间规整DTW是语音识别中的一种经典算法。对此算法提出了一种改进的端点检测算法,特征提取采用了Mel频率倒谱系数MFCC,并采用计算量相对较小的改进的动态时间规整算法实现语音参数模板匹配,能够实现孤立词、特定人、小词汇量的语音识别,并用Matlab进行了算法仿真。试验结果表明,改进后的算法能够有效地提高系统对语音的识别率。  相似文献   

3.
张军  李学斌 《计算机仿真》2009,26(10):348-351,364
针对动态时间规整(DTW)对孤立词端点检测准确性过度依赖的问题,针对上述问题,采用放宽端点和限定动态规整计算范围结合的算法,不仅更准确的放松前后端点降低端点检测的敏感度,而且结合对动态规整计算范围的限定,减少计算量,提高执行效率。分别测试了基于传统DTW算法的识别率和改进后DTW算法的识别率。实验结果表明,改进后的算法,能有效提高孤立词识别率。  相似文献   

4.
根据汉语语音的特点,提出了一种无端点检测的语音识别算法。在识别过程中,该算法无需确定语音信号起止点位置,而是从寂静段开始,直接按帧提取特征(帧长20ms,帧间重叠50%),特征向量由15阶倒谱系数和帧平均能量组成。在动态时间规整(DTW)和隐马尔可夫(HMM)统一模型(DHUM)中,引进寂静段自环,并用DHUM实现了该算法。对99个相似汉语单字的识别实验表明:无端点检测的识别器正识率为94.95%,正识率下降很少,但不作端点检测却降低了算法的复杂程度。该算法中,若特征向量采用一种听觉模型特征,识别器具有更好的鲁棒性,识别率会略有提高。  相似文献   

5.
针对现有的非特定人语音识别系统存在词汇数据库庞大、训练过程复杂的问题,采用VC++实现了一种特定人语音识别算法。该算法采用先预加重后端点检测的方法来消除低频噪声的影响;选择短时能量和短时过零率2个指标作为语音信号端点检测的依据;加入了可容忍静音时间的判断来保证检测到的语音数据的完整性;采用改进的动态时间规整算法进行模式匹配,在不影响计算结果的前提下减少了运算量。测试结果表明,该算法能够对短词和短句进行实时、准确识别,并具有较快的识别速度。  相似文献   

6.
带噪汉语语音识别的端点检测方法   总被引:4,自引:0,他引:4  
王朋  塔维娜  陈树中 《计算机工程》2003,29(17):120-121,135
在语音识别系统中产生错误识别的原因之一是端点检测有误差,在高信噪比情况下,正确地确定语音的端点并不困难,然而,大多数实际的语音识别系统需工作在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法在噪声环境下不能有效地工作。该文利用改进的隐马尔柯夫模型(HMM)进行语音检测以适应噪声的变化,实验结果表明本方法可得到高正确率的带噪语音端点检测。  相似文献   

7.
孤立字词识别   总被引:6,自引:0,他引:6  
本文主要介绍了语音识别的一般方法和策略,对动态时间规整(DTW)算法的基本原理进行了说明,并利用该算法实现了一个简单的非特定人孤立字词识别系统。  相似文献   

8.
动态时间规整(Dynamic Time Warping)是语音识别中的一种经典算法,该算法简单有效,在实现孤立词识别系统中得到了广泛的应用.为了提高机器人语音识别系统的识别率和识别速度,文中采用了一种改进的DTW语音识别算法.在MATLAB 7.0环境下,对改进的语音端点检测和改进的DTW算法进行仿真实验,实验证明改进的算法提高了识别率,并且减少了识别所用的时间;将该算法移植到机器人上,在安静的环境下进行试验,结果表明机器人能准确而又快速地识别语音内容.最后,得到了改进的语音识别算法能够有效提高识别率和识别速度的结论.  相似文献   

9.
语音识别中,动态时间规整(Dynamic Time Warping,简称DTW)和隐马尔可夫模型(Hidden Markov Model,简称 HMM)是最有效的两种识别算法,并且 DTW和 HMM在本质上是一致的~[1]。根据 DTW和 HMM的本质联系和各自所对应的声学模型,在前期工作中建立了一种广义声学模型 ~[2][3](General Model,简称 GM),并指出 DTW和HMM 只是 GM的特例,且 DTW和 HMM都可以转化为 GM。并在此基础上,首次将 Fisher算法~[4]引进GM的学习算法,确保了GM状态分割的收敛性,并且这种分割在最小离差意义上是全局精确最优的。最后,从大数定理的角度出发,对 GM算法的收敛性进行了分析, 从理论上论证了该算法的依概率收敛性,并为实际应用中 GM算法的有效性提供了理论依据。  相似文献   

10.
语音识别中动态时间规整和隐马尔可夫统一模型   总被引:1,自引:0,他引:1  
对于目前在语音识别中广泛使用的两种技术即动态时间规整(DTW)技术和隐马尔可夫模型(HMM)的本质联系,提出了二者的统一模型(DHUM,DTW and HMM Uni-fied Model),并分别给出DTW和HM向DHUM的转换关系。文中还提出了用DHUM解决更接近语音实际情况的高阶HMM作语音识别时所面临的运算量过大的问题。中等词表的识别实验结果表明,建立在DHUM之上的识别器的识别性能不低于  相似文献   

11.
动态时间规整(Dynamic Time Warping)是语音识别中的一种经典算法,该算法简单有效,在实现孤立词识别系统中得到了广泛的应用。为了提高机器人语音识别系统的识别率和识别速度,文中采用了一种改进的DTW语音识别算法。在MATLAB 7.0环境下,对改进的语音端点检测和改进的DTW算法进行仿真实验,实验证明改进的算法提高了识别率,并且减少了识别所用的时间;将该算法移植到机器人上,在安静的环境下进行试验,结果表明机器人能准确而又快速地识别语音内容。最后,得到了改进的语音识别算法能够有效提高识别率和识别速度的结论。  相似文献   

12.
语音识别的研究与发展   总被引:8,自引:0,他引:8  
综合阐述了语音识别技术的提出与发展历史 ,语音识别系统的分类 ,目前所面临的困难和采用的主要技术 ,以及发展方向和应用前景。  相似文献   

13.
提出基于短时能量和过零率的简化语音信号双门限端点检测算法,搭建Matlab的算法仿真平台,实验结果表明,基于短时能量和过零率的双门限端点检测算法在保证检测率的前提下,运算复杂度和运算量均优于倒谱、分形、加权门限端点检测方法。采用Verilog语言完成了该模块的设计和仿真,并成功应用于孤立词语音识别系统中。该语音识别系统采用定点数设计方式,语音信号的采样频率为8kHz,每次采样的数据为8bits,晶片内部稳定工作频率为20MHz。实验结果表明,在200个词源的条件下,平均可以达到90%以上的识别效果。  相似文献   

14.
朱淑琴  赵瑛 《微计算机信息》2012,(5):150-151,163
研究动态时间规整(Dynamic Time Warping)语音识别算法问题,传统动态时间规整方法需要存储较大的矩阵,直接计算将会占据较大的空间,计算量也比较大,对系统硬件要求比较高。为了减小DTW算法的运算量,提高识别速度,对DTW语音识别算法进行优化改进。将局部路径约束和整体路径约束相结合,仅在一个规定的宽度内搜索动态规划路径,计算累积匹配距离。仿真实验结果表明该方法不仅可以降低运算负载,提高识别速度,而且能在一定程度上提高语音识别率。  相似文献   

15.
针对目前动态手势识别计算复杂度较高以及对实验器材有相应要求的问题,提出基于多特征融合的动态手势识别.使用OpenPose得到手部关键点信息,建立手势模型,将坐标信息利用手部的结构关系进行处理,得到手部的角度和长度特征.将角度特征序列和长度特征序列进行融合,利用阈值设定过滤序列中的奇异点,使用FastDTW算法计算待测动...  相似文献   

16.
本文给出一个在CBuilder中利用WindowAPI函数实现交互式录音的方法,能在误音识别时做到边录音边识别,效果良好。  相似文献   

17.
基于DTW的孤立词语音识别研究和算法改进   总被引:2,自引:0,他引:2  
DTW算法在实现小词汇表孤立词识别系统时既简单又有效,在特定的场合下获得了广泛的应用。但DTW算法实际应用时有许多缺点,本文对语音识别数学模型DTW作了深入的研究,提出了改进算法。  相似文献   

18.
利用语音传递信息是人类最常用,最方便,最快捷的一种方式。人类最常用的传递信息的方式就是声音,随着现代信息化时代的不断发展,人们更加深入的研究语音信号的处理技术,并且由于语音的特殊作用及其重要性,还有其对人们生活的不断深入的影响,使得其十分受关注。语音识别技术就是将说话人的语言转变为计算机可以听懂的语言,语音识别技术的涉及面极广,它涉及到多个学术领域,如计算机科学、语言学、神经生理学、信号处理以及人工智能等。  相似文献   

19.
一种机器人智能语音识别算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
周璐璐  邓江洪 《计算机测量与控制》2014,22(10):3267-32693273
针对智能机器人在非特定人语音识别中识别率偏低的问题,提出了一种双门限的端点检测算法,精确地检测出了语音端点,对分形维数和Mel频率倒谱系数(MFCC)进行结合,同时基于隐马尔可夫(HMM)模型,提出了智能机器人命令识别系统;在实验室环境下,利用Cool Edit软件录制了5男5女的语音,采样率为8kHz,精度为16位,内容为5个命令词,每个词均被采集6次,将每人的前3次发音作为模板语音,后3次发音作为测试语音,实验结果表明,系统识别率可以达到85%以上,MFCC与分形维数混合的语音特征参数的算法提高了系统识别率,优化了系统性能;该方法用于非特定人语音智能识别是可行的、有效的。  相似文献   

20.
设计并实现了一个特定人、孤立词、小词汇量的嵌入式语音识别模块,该模块能够方便地与多种控制芯片接口从而实现不同的功能.在硬件上,使用高速的TMS320VC5402芯片作为模块的运算单元;在软件上,采用谱减法进行前端去噪处理,接着根据谱熵进行语音端点检测,然后提取12维MFCC及其一阶差分作为特征参数,最后用加入模板阈值方法的改进型DTW算法完成整个识别过程.实验结果证明,该语音识别模块在满足实时性的前提下具有良好的识别率和抗干扰性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号