首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
模型训练是HMM应用于语音识别时重要的一环,本文首先简要介绍了HMM及其三大基本问题,针对Baum-Welch算法收敛速度慢和易陷于局部最优解的缺陷,归纳总结了基于分段K均值算法、基于遗传算法、基于随机松弛算法的三大改进算法,通过实验验证了改进算法可以提高语音识别效果。  相似文献   

2.
基于语音识别系统中DTW算法改进技术研究   总被引:5,自引:8,他引:5  
动态时间规整(DynamicTimeWarping)是语音识别中的一种经典算法,由于算法简单又有效,因此在实现孤立词识别系统中获得了广泛的应用,但仍然存在一些不足,本文从提高识别率和识别速度入手提出对DTW算法进行改进研究,以达到更满意的语音识别效果。  相似文献   

3.
提出了一种基于小波变换的新型语音参数提取算法 ,提高语音识别系统对环境噪声的鲁棒性。由于引入了多分辨率小波分析技术 ,识别既在高频提供高的频率分辨又在低频提供高的时间分辨率。这样 ,提出的改进算法在语音词汇的识别更准确的同时 ,还大大简化了计算。将该算法和传统提取 MFCC系数的算法进行了比较,实验结果表明 ,利用小波计算语音特征具有更优的性能。  相似文献   

4.
针对语音识别中动态时间规整(DTW)对语音端点检测精确性过度依赖、识别时间长及识别效率低等问题.为提高语音识别精度和效率,采用改进型的蚁群算法来处理动态时间规划间题,核心是对基本蚁群算法采用自适应的挥发系数,动态信息素更新策略.用新的状态转移规则以及最优的蚂蚁参数选择等改进方法,使能在较短的时间内能寻找到最佳路径,提高执行效率.仿真实验分别测试了传统DTW算法和基于改进蚁群算法的DTW算法的识别率,结果表明,新算法的全局搜索能力、准确性都优于传统的DTW算法,能有效的提高语音识别系统的效率.  相似文献   

5.
基于快速神经网络算法的非特定人语音识别   总被引:4,自引:0,他引:4       下载免费PDF全文
提出一种用于语音识别的改进的快速神经网络算法 ,即动态不等步长的误差分段学习算法。将步长看作误差和网络节点输出的函数 ,对各权值按不同步长进行动态调整 ,并将其应用于一个基于前馈神经网络模型的非特定人语音识别系统。实验表明 ,该算法比传统 BP算法在训练速度上可提高十几倍 ,训练出的语音识别网络系统具有较高的识别率  相似文献   

6.
在对语音识别基本理论阐述的基础上,研究了DHMM、DTW和CHMM三种不同的语音识别算法,并通过在MATLAB环境下搭建孤立词数字语音识别系统得出三种不同语音识别算法的具体运行数据,验证了识别理论的正确性,对比三种不同语音识别算法优缺点,为硬件实现语音识别系统提供了重要参考。  相似文献   

7.
压缩感知CS(compressive sensing)是一种基于信号稀疏性,有效提取信号中有用信息的方法。根据语音信号和干扰噪声在离散余弦变换域DCT(discrete cosine transform)稀疏性的不同,提出一种基于改进压缩感知的说话人识别抗噪算法。在用正交匹配追踪OMP(orthogonal matching pursuit)算法重构语音信号时设定相关度阈值和语音恢复阈值,不仅有效恢复了语音信号,而且实现了语音增强。然后通过Gammatone滤波器组,对恢复语音信号进行处理,提取特征参数GFCC。仿真实验在高斯混合模型识别系统中进行,实验结果表明,将这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显提高。  相似文献   

8.
《微型机与应用》2017,(14):11-13
针对汉语语音识别中的一个分支——数码语音识别(MDSR)系统做出了具体的分析,并实验仿真了一个MDSR系统。在训练和识别阶段,引入了HMM模型的定义,为了提高识别的速度,还针对HMM系统中的核心识别算法Viterbi进行了改进,提出了一种累计积分判定的方法,对原Viterbi算法中的路径进行了剪裁,减少了冗余状态。使用MATLAB R2007a对此算法进行仿真实验,证明在相同语音识别系统的环境下,改进的Viterbi算法可以更有效地提高计算速度,且识别差错率没有明显的提高。  相似文献   

9.
针对语音识别的特点,对BP神经网络在语音识别技术中的应用进行了探索性研究,进而结合人工智能领域较为有效的方法——遗传(GA)算法,针对传统BP算法识别准确率高但训练速度慢的缺点,对BP网络进行改进,构建了一种基于遗传神经网络的语音识别算法(GABP),并建立相应的语音识别系统。仿真实验表明,该算法有效地缩短了识别时间,提高了网络训练速度和语音的识别率。  相似文献   

10.
随着中西方交流日益频繁,语言的沟通就显得尤为重要。本文通过对中英语音翻译系统的三个模块"汉语语音识别模块、汉-英机器翻译模块和汉、英语语音合成模块"的分析,构建了语音翻译信号数字模型,同时通过语音识别的基本原理,提出了一种改进的语音识别DTW算法。通过仿真和实验证明了改进的语音识别DTW算法是可行的。  相似文献   

11.
动态时间规整(Dynamic Time Warping)是语音识别中的一种经典算法,该算法简单有效,在实现孤立词识别系统中得到了广泛的应用。为了提高机器人语音识别系统的识别率和识别速度,文中采用了一种改进的DTW语音识别算法。在MATLAB 7.0环境下,对改进的语音端点检测和改进的DTW算法进行仿真实验,实验证明改进的算法提高了识别率,并且减少了识别所用的时间;将该算法移植到机器人上,在安静的环境下进行试验,结果表明机器人能准确而又快速地识别语音内容。最后,得到了改进的语音识别算法能够有效提高识别率和识别速度的结论。  相似文献   

12.
动态时间规整(Dynamic Time Warping)是语音识别中的一种经典算法,该算法简单有效,在实现孤立词识别系统中得到了广泛的应用.为了提高机器人语音识别系统的识别率和识别速度,文中采用了一种改进的DTW语音识别算法.在MATLAB 7.0环境下,对改进的语音端点检测和改进的DTW算法进行仿真实验,实验证明改进的算法提高了识别率,并且减少了识别所用的时间;将该算法移植到机器人上,在安静的环境下进行试验,结果表明机器人能准确而又快速地识别语音内容.最后,得到了改进的语音识别算法能够有效提高识别率和识别速度的结论.  相似文献   

13.
一种改进的基于说话者的语音分割算法   总被引:13,自引:1,他引:13  
卢坚  毛兵  孙正兴  张福炎 《软件学报》2002,13(2):274-279
语音分割是语音识别和语音文档检索等众多语音应用的基础.提出一种改进的基于说话者的语音分割算法,对GLR和BIC相结合的算法作进一步的改进:(1) 基于GLR距离方差的自适应阈值调整算法改进了不同声学特征下基于距离的语音分割算法中的阈值选取方法;(2) 引入BIC可测度概念来度量其适用范围;(3) BIC信息准则校准非冗余的候选分割点的偏差.实验结果表明,此改进算法优于原算法.  相似文献   

14.
动态时间规正(Dynamic Time Warping)是语音识别中的一种经典算法,算法简单有效,因此在实现孤立词识别系统中获得了广泛的应用。提出一种DTW的改进算法,采用两次在时间域上的规正,使计算程序简洁规范,计算量减少。经实验验证,改进DTW算法在不降低识别率的前提下,提高了识别速度,提高了系统的实用性。  相似文献   

15.
基于DTW的语音识别和说话人识别的特征选择   总被引:1,自引:0,他引:1  
研究了基于动态时间规正(DTW)和图论方法的语音识别和说话人识别的特征子集选择问题,提出了基于DTW距离的有向图方法(DTWDAG).此方法推广了基于欧氏距离的相似矩阵聚类方法,将图论聚类方法改进为语音和说话人特征选择的代价函数.并将此代价函数与(l-r)优化算法结合应用于孤立数字的特定人的语音识别和文本有关的说话人辩认的特征选择,实验结果表明,DTWDAG方法能够较好反映语音识别和说话人识别的特征子集的重要性.  相似文献   

16.
本文介绍了基于μ'nSP内核的SOC上的说话人识别算法改进的研究及实现。采用一种改进的端点检测算法,提高了识别率。并利用随机语音提示的方式,来解决身份确认中的录音作弊问题。取得了良好的效果。  相似文献   

17.
情感特征提取是语音情感准确识别的关键,传统方法采用单一特征或者简单组合特征提取方法,单一特征无法全面反映语音情感变化,简单组合特征会使特征间产生大量冗余特征,影响识别正确结果.为了提高语音情感识别率,提了一种蚁群算法的语音情感智能识别方法.首先采用语音识别正确率和特征子集维数加权作为目标函数,然后利用蚁群算法找到最优语音特征子集,消除特征冗余信息.通过汉话和丹麦语两种情感语音库进行仿真测试,仿真结果表明,改进方法不仅消除了冗余、无用特征,降低了特征维数,而且提高了语音情感识别率,是一种有效的语音情感智能识别方法.  相似文献   

18.
建立声学模型是说话人识别技术的重要环节.文章介绍了一种改进的GMM算法,将基于样本和核的相似性度量的动态聚类算法与传统高斯混合模型结合起来进行建模,识别辨认时,对语音帧得分进行加权处理.实验表明:改进后的与文本无关的说话人辨认系统无论是在建模时间还是识别效率上都要高于传统的基于GMM的说话人辨认系统.  相似文献   

19.
王晓兰  周献中 《计算机应用》2005,25(10):2230-2232
有些应用场合中语音识别系统的待识别词表确定,但对识别结果要求严格,针对这样的应用,提出了一种语法规则——句序字位规则,并且给出了一种基于连续语音识别的Viterbi算法和句序字位法的语音识别算法。最后针对一组指挥命令进行了实验,实现了格式正确的有限命令识别。  相似文献   

20.
基于改进VQ算法的文本无关的说话人识别   总被引:3,自引:2,他引:3  
基于矢量量化的说话人识别,因其运算过程简单等特点,在文本无关的说话人识别领域有着广泛的应用。论文根据说话人识别中训练语音的特点并结合快速搜索算法,对矢量量化的码书形成算法进行了改进,提出了一种基于改进算法的与文本无关的说话人识别方法。经实验结果证明,论文的方法加快了码书的形成,减少了码书形成的计算量,改善了码本的性能,提高了说话人识别的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号