首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 87 毫秒
1.
为了方便学生使用中文或英文说出学号与名字登录注册系统,设计了中英文数字语音登录系统。采用MFCC(Mel频率倒谱系数)作为语音特征参数,在隐马尔可夫模型HMM(HiddenMarkovModel)框架下建立了基于语音识别开发工具包HTK的中英文连续数字语音识别系统,包括对语音信号的预处理、特征参数的提取,识别模版的训练,最后送到识别器进行识别。通过建立中文、英文和中英文混合训练集和测试集声学模型,并得到了较高的识别率,从而加强多媒体注册系统的稳定性和鲁棒性。  相似文献   

2.
以Xilinx公司Virtex-II Pro为开发平台,实现了一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)非特定人的孤立词语音识别系统.系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,减少了要处理的语音帧数.实验表明系统在150词条的情况下识别率达到97.3%,识别时间为1.42倍实时.  相似文献   

3.
陈慧  芮贤义 《电声技术》2016,40(8):36-39
在VC++的编程环境下设计了一个小词汇量孤立词非特定人的汽车语音识别系统,系统中的识别词汇都是汽车驾驶员在驾驶过程中可能做的一些手控操作.语音预处理采用的是改进后的端点检测算法.实验分析时,在测试数据中加入噪声库(NoiseX-92)中的车内噪声来模拟汽车驾驶环境,并提出随机映射梅尔频率倒谱系数来增强噪声环境下系统的鲁棒性.测试数据表明,使用随机映射特征参数使得系统的抗噪声能力得到了很大的提升.  相似文献   

4.
提出了一种结合韵律信息的高性能汉语连续数字语音识别算法,该识别算法基于CHMM(连续隐马尔可夫模型),采用MFCC(MEL频率倒谱系数)为主要语音特征参数,结合韵律信息进行连续数字精确分割,能够有效区分易混数字。算法采用两级识别框架来提高语音识别率,其中,第1级对连续数字分割,在此基础上进行数字语音识别,输出各候选结果,第2级在候选结果中确定易混数字对,并运用韵律信息进一步选择正确结果。实验表明,最终汉语连续数字语音识别率有很大提高。  相似文献   

5.
戴加宁 《电子学报》1997,25(7):75-77
本文探讨经短时信号处理后的语音信号帧间相关信息对基于隐马尔可夫模型(HMM)的语音识别系统识虽精度的影响,鉴于HMM的输出独立假设导致语音帧间相关信息的损失,本文提出了一种描述帧间相关信息的统计模型-马尔可夫链(MCM)用来弥补HMM在这方面的缺陷;经非特定人和多话者孤立字实验表明,用MCM作为HMM的辅助模型,可将原有HMM系统的识别率提高约1~6个百分点。  相似文献   

6.
沈泉波 《电声技术》2012,36(10):56-57,70
隐马尔可夫模型(HMM)已成为语音识别中的主流技术,首先介绍了语音识别技术的原理和结构,然后介绍了HMM的三个基本问题及其解决方法,最后利用Matlab仿真工具设计了一个孤立词的语音识别系统,实现了数字0~9的识别.  相似文献   

7.
李战明  苏敏  赵正天  李二超 《电声技术》2007,31(12):44-46,50
基于隐马尔可夫模型(HMM)和改进后的概率神经网络(PNN)模型提出了一种用于语音识别的混合模型,该模型首先利用HMM生成最佳语音状态序列,然后对最佳状态序列进行时间规整,最后通过PNN神经网络进行分类识别。给出了HMM参数训练及时间规整的算法。实验结果表明这种模型比HMM具有更好的识别效果。  相似文献   

8.
《信息技术》2019,(6):91-95
随着中国经济高速发展以及全球一体化的进程,英语成为了人们日常交流必不可少的工具,然而对于初学者来说,能够通过语音识别技术将语音信号转化成文本的格式,更有利于快速掌握英语。而且语音识别技术经过多年的发展依然具有巨大的挖掘潜力,面对移动互联网的快速发展,通过对实时通信工具的大数据量的需求爆发,英语语音识别的实时性和系统稳定性越来越受到关注,文中分析了常用的传统语音识别技术,例如动态时间规整、神经网络模型和隐马尔可夫模型等,运用隐马尔可夫模型对语音信号进行处理和识别,提取出特征参数,与经过训练的模型体系进行匹配,找出最优的识别序列。然后在PC平台上,利用MATLAB建模仿真,基本实现了英语语音短句的识别,对于后续的硬件产品实现打下了良好的基础,具有积极的现实意义。  相似文献   

9.
智能机器人语音识别技术   总被引:3,自引:0,他引:3  
张珍 《现代电子技术》2011,34(12):57-60
给出了一种由说话者说出控制命令,机器人进行识别理解,并执行相应动作的实现技术。在此,提出了一种高准确率端点检测算法、高精度定点DSP动态指数定标算法,以解决定点DSP实现连续隐马尔科夫模型CHMM识别算法时所涉及的大量浮点小数运算问题,提高了定点DSP实现的实时性、精度,及其识别率。  相似文献   

10.
欧智坚  王作英 《电子学报》2003,31(4):608-611
尽管作为当前最为流行的语音识别模型, HMM由于采用状态输出独立同分布假设,忽略了对语音轨迹动态特性的描述.本文基于一个更为灵活的语音描述统计框架—广义DDBHMM,提出了一个具体的多项式拟合语音轨迹模型,以及新的训练和识别算法,更好地刻划了真实的语音特性.本文还给出了一种有效的剪枝算法,得到一个实用化模型.汉语大词汇量非特定人连续语音识别的实验表明,这种剪枝的多项式拟合语音轨迹模型以较少的计算量明显改善了识别系统的性能.  相似文献   

11.
谢锦辉 《通信学报》1994,15(2):83-87
本文简要讨论了在基于HMM的连续语音识别系统中怎样选取基本语音单元的问题,介绍了在欧洲Polyglot课题下在法国LINSI-CNRS建立的基于上下文无关音素HMM。然后,本文详细给出了利用左或右上下文相关音素HMM,作者对上述系统改进后进行的连续语音识别,有用美国语音库DARPA-RM1,在不考虑句法信息时,我们获得了连续时词识别率大约3-10个百分点的明显提高。实验是在法国LIMSI-CNRS  相似文献   

12.
马帅  高岳  何翔宇 《电子质量》2011,(4):17-18,21
HMM模型(隐含马尔科夫模型)由于对时间序列结构具有较强的建模能力.而逐步成为主流的语音识别技术.该文首先深入浅出地概述了基于HMM的语音识别技术,然后介绍了三个基本问题,最后在MATLAB下实现了孤立词语音识别系统.  相似文献   

13.
高建 《现代电子技术》2011,34(11):205-207
为了提高语音识别效率及对环境的依赖性,文章对语音识别算法部分和硬件部分做了分析与改进,采用ARMS3C2410微处理器作为主控制模块,采用UDA1314TS音频处理芯片作为语音识别模块,利用HMM声学模型及Viterbi算法进行模式训练和识别,设计了一种连续的、小词量的语音识别系统。实验证明,该语音识别系统具有较高的识别率和一定程度的鲁棒性,实验室识别率和室外识别率分别达到95.6%,92.3%。  相似文献   

14.
语音信号的Bark子波变换及其在语音识别中的应用   总被引:16,自引:1,他引:16       下载免费PDF全文
付强  易克初 《电子学报》2000,28(10):102-105
本文首先在语音感知实验基础上所得到的Bark尺度概念与子波的构造联系起来,提出了一种语音信号Bark子波及其变换.在感知特性中,它与人耳的听觉系统是直接吻合的:在数学上,它是一种非正交的但却是超完备的,可逆且是自反演的子波变换.应用在语音识别中时,利用子波的局部基性质,取较小的分析帧长,提高了前端处理的时间分辨率.实验表明,所形成的新特征在对辅音区别能力方面明显优于目前应用于广泛的MFCC特征.  相似文献   

15.
王大巍 《电子技术》2010,47(7):21-22
语音口令识别是语音信息处理的一个重要研究方向,本文给出一种基于嵌入式系统的语音口令识别系统的设计方案,硬件系统的核心芯片是嵌入式微处理器,语音口令识别算法采用连续隐马尔克夫模型。实验结果表明,将语音识别系统与嵌入式系统相结合,可以使语音口令识别系统广泛应用于便携式设备中。  相似文献   

16.
吴进强 《电视技术》2013,37(10):27-30
为了提高智能电视的人机交互性,使复杂的功能易于操作,提出了一种基于Android智能电视的语音识别系统设计方案。该方案使得智能电视具备了语音自动网络搜索的功能;采用识别命令动态注册方法为第三方应用程序开发提供接口;通过强大的中英文词库,可识别中、英、中英混合语音信号,并且支持手机、遥控器语音控制电视,大大提高了智能电视的可操作性,丰富了人们的数字化生活。  相似文献   

17.
汉语语音正弦模型特征分析和听觉辨识   总被引:1,自引:0,他引:1  
张毅楠  肖熙 《电声技术》2011,35(8):38-41
为了研究汉语语音的声学特征,将语音信号的正弦模型应用于语音的特征提取和分析,通过对语音的模型参数应用峰值匹配算法,得到了基于正弦模型的语谱图.该语谱图能直观地反映出语音信号中基音频率及共振峰的细节及其变化规律,为语音信号的分析提供了可视化的工具.在此基础上,对汉语单韵母音节的前两个共振峰进行了分析,在控制使用少数几个主...  相似文献   

18.
In this paper, a feature extraction (FE) method is proposed that is comparable to the traditional FE methods used in automatic speech recognition systems. Unlike the conventional spectral‐based FE methods, the proposed method evaluates the similarities between an embedded speech signal and a set of predefined speech attractor models in the reconstructed phase space (RPS) domain. In the first step, a set of Gaussian mixture models is trained to represent the speech attractors in the RPS. Next, for a new input speech frame, a posterior‐probability‐based feature vector is evaluated, which represents the similarity between the embedded frame and the learned speech attractors. We conduct experiments for a speech recognition task utilizing a toolkit based on hidden Markov models, over FARSDAT, a well‐known Persian speech corpus. Through the proposed FE method, we gain 3.11% absolute phoneme error rate improvement in comparison to the baseline system, which exploits the mel‐frequency cepstral coefficient FE method.  相似文献   

19.
基于DTW算法的语音识别系统实现   总被引:10,自引:0,他引:10  
动态时间归整(DTW)算法的实现简单有效,在孤立词语音识别系统中得到了广泛的应用.介绍了将DTW算法移植到TMS320VC5402上实现孤立词语音识别的原理、系统硬件组成和软件设计.研究结果表明,系统能满足实时性能要求,识别效果良好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号