首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
胡石  章毅  陈芳  陈心怡 《通讯世界》2017,(8):233-234
语音识别是近些年来一项高速发展的技术.让计算机识别人的语音,甚至让人和计算机进行交流是所有从事模式识别专业人的梦寐以求的理想.本文主要介绍了应用于模式识别系统中的隐马尔科夫模型的基础理论,以及在隐马尔科夫模型理论的基础上建立了一种语音识别系统.详细探讨了这种模型系统中声学模型的建立过程,最后提出了这种基于HMM模型的语音识别系统的优点和改进展望.  相似文献   

2.
本文针对问题一建立了基于连续隐马尔科夫模型的语音识别系统的模型。该语音识别系统包括预处理,特征提取以及声学模型三个部分。问题二要求以一个实际的例子则对问题一中建立的模型进行验证。我们选择了"话费查询"这个功能进行测试。待测语音信号依次经过预处理、特征提取、训练与识别。  相似文献   

3.
语音识别是人机语音通信的关键技术之一,也是难题之一.介绍了一种语音识别系统,主要介绍了该系统的语音处理流程,阐述了系统使用Mel频标倒谱参数作为特征提取的方法,采用隐马尔科夫模型算法的测度估计技术.通过严格测试,该系统达到实用化要求.该语音识别系统较好的实现了在移动电子设备上资源有限条件下方便快捷的汉字语音输入,具有重大现实意义.  相似文献   

4.
汪丹丹 《电子世界》2014,(9):175-176
本文以基于隐马尔科夫模型的语音识别系统为基线系统,提出了一种基于遗传算法的语法网络搜索方法,应用于语音识别系统的语法网络搜索模块。通过遗传算法解码得到的搜索结果虽然不唯一但都是满意解,提升了该模块的全局优化搜索能力。  相似文献   

5.
HMM在语音识别系统中的应用   总被引:1,自引:0,他引:1  
介绍语音识别技术的应用状况与发展,对基于动态时间伸缩技术、隐含马尔科夫模型及人工神经网络的3种不同的语音识别系统进行了比较,重点介绍了隐含马尔科夫模型(HMM)在语音识别系统中的应用。其中基于HMM的语音识别系统是在UniSpeech芯片上实现基于DHMM的识别系统,然后又在同一平台上实现了基于CHMM的识别系统。  相似文献   

6.
胡丹  曾庆宁  龙超  黄桂敏 《电视技术》2015,39(24):43-46
针对大词汇量连续语音识别中识别率不高的问题,提出了将语音增强级联在识别系统前端,在语音增强中将谱减法和对数最小均方误差算法(logmmse)与用于噪声估计的最小控制递归平均算法(imcra)相结合。识别系统使用Mel频率倒谱系数(MFCC)提取特征,用隐马尔科夫模型(HMM)训练与识别。实验结果表明,提出的方法最高能使单词识别率提高38.9%,使句子正确率提高21.8%。该方法用于大词汇量连续语音识别是可行的,有效的。  相似文献   

7.
黄岗 《电子设计工程》2013,21(17):60-62
通过对马尔可夫模型进行深入的分析的基础上对隐马尔科夫模型做了详细的讨论,对马尔科夫模型在语音识别、疾病分析等方面的应用做了介绍,同时针对隐马尔科夫模型在估值问题、解码问题和学习问题等经典问题上的应用做了研究。最后讨论了马尔科夫模型其隐马尔可夫模型的缺陷,并提出相关的改进建议。  相似文献   

8.
王大巍 《电子技术》2010,47(7):21-22
语音口令识别是语音信息处理的一个重要研究方向,本文给出一种基于嵌入式系统的语音口令识别系统的设计方案,硬件系统的核心芯片是嵌入式微处理器,语音口令识别算法采用连续隐马尔克夫模型。实验结果表明,将语音识别系统与嵌入式系统相结合,可以使语音口令识别系统广泛应用于便携式设备中。  相似文献   

9.
设计了一种基于连续概率密度隐含马尔科夫模型的汉语语音识别系统。在实时录音的情况下,利用该语音识别系统,不同的人对10条2~4个字的语音命令进行识别,准确率可达到90%,识别时间1.5~3s。  相似文献   

10.
马帅  高岳  何翔宇 《电子质量》2011,(4):17-18,21
HMM模型(隐含马尔科夫模型)由于对时间序列结构具有较强的建模能力.而逐步成为主流的语音识别技术.该文首先深入浅出地概述了基于HMM的语音识别技术,然后介绍了三个基本问题,最后在MATLAB下实现了孤立词语音识别系统.  相似文献   

11.
王维强 《电子设计工程》2012,20(12):186-189
设计了一个嵌入式语音识别系统,该系统硬件平台以ADSP-BF531为核心,采用离散隐马尔可夫模型(DHMM)检测和识别算法完成了对非特定人的孤立词语音识别。试验结果表明,该系统对非特定人短词汇的综合识别率在90%以上。该系统具有小型、高速、可靠以及扩展性好等特点;可应用于许多特定场合,有很好的市场前景。文中讲述了该系统CODEC、片外RAM、ROM以及CPLD等与DSP的接口设计,语音识别运用的矢量量化、Mel倒谱参数、Viterbi等有关算法及其实际应用效果。  相似文献   

12.
Although the continuous hidden Markov model (CHMM) technique seems to be the most flexible and complete tool for speech modelling. It is not always used for the implementation of speech recognition systems because of several problems related to training and computational complexity. Thus, other simpler types of HMMs, such as discrete (DHMM) or semicontinuous (SCHMM) models, are commonly utilised with very acceptable results. Also, the superiority of continuous models over these types of HMMs is not clear. The authors' group has previously introduced the multiple vector quantisation (MVQ) technique, the main feature of which is the use of one separated VQ codebook for each recognition unit. The MVQ technique applied to DHMM models generates a new HMM modelling (basic MVQ models) that allows incorporation into the recognition dynamics of the input sequence information wasted by the discrete models in the VQ process. The authors propose a new variant of HMM models that arises from the idea of applying MVQ to SCHMM models. These are SCMVQ-HMM (semicontinuous multiple vector quantisation HMM) models that use one VQ codebook per recognition unit and several quantisation candidates for each input vector. It is shown that SCMVQ modelling is formally the closest one to CHMM, although requiring even less computation than SCHMMs. After studying several implementation issues of the MVQ technique. Such as which type of probability density function should be used, the authors show the superiority of SCMVQ models over other types of HMM models such as DHMMs, SCHMMs or the basic MVQs  相似文献   

13.
介绍了用离散隐马尔可夫模型(DHMM)构造孤立词语音识别系统中的特征向量矢量量化的码书构造过程。以往的矢量量化通常采用基本算法LBG,在此基础上,引入了一种时间复杂性和空间复杂性有所降低的改进算法。该算法的核心是自适应地生成初始码书以及对初始码书的二次构造过程。从降低时间复杂度和节省存储空间,提高识别率的角度,对该算法进行了讨论。  相似文献   

14.
于春雪 《电声技术》2012,36(1):55-59,73
采用ARM处理器$3C2440A构建嵌入式系统,利用音频芯片UDA1341TS对语音信号进行编解码,应用语音识别技术实现语音控制。介绍了系统设计原理和工作机制,并阐述了控制选单的软硬件设计方案和识别算法原理,给出测试方法。实验结果表明,系统能实现特定指令的语音控制,识别率高、实时性好,可适应复杂的工作环境。  相似文献   

15.
王超  吴亚锋 《电声技术》2007,31(11):52-54,60
音频自动分类是解决音频结构化问题和提取音频内容语义的重要手段之一,是当前基于内容的音频检索领域的一个研究热点。在考察音频数据特征的基础上,针对左-右密度隐马尔可夫模型(left-right DHMM)不能很好反映音频中状态反复的缺点,提出了一种基于各态历经混合高斯密度隐马尔可夫模型(EMGD_HMM)的分类器,并应用于语音、音乐和它们的混合声音的分类。实验结果表明,EMGD_HMM的分类精度要优于left-right DHMM。  相似文献   

16.
应用于语音识别片上系统的语音检测算法   总被引:2,自引:0,他引:2  
语音识别技术的研究已经进入实用化阶段,而实用化语音识别系统中的一个关键技术就是可靠的语音检测。本文提出了一种基于有限状态机模型的实时语音检测算法(FSM-SD)。采用对数最大似然判决帧能量检测器和过零率检测器控制各状态之间的跳转关系。针对语音识别中的MFCC(Mel频标倒谱系数)和LPCC(线性预测倒谱参数)特征提取过程,分别得到两种不同的帧能量计算方法。将FSM-SD应用到在OAK DSP上实现的小词表汉语语音识别系统,通过实验验证了其对系统识别性能和噪声稳健性的有效保证。  相似文献   

17.

Majority of the automatic speech recognition systems (ASR) are trained with neutral speech and the performance of these systems are affected due to the presence of emotional content in the speech. The recognition of these emotions in human speech is considered to be the crucial aspect of human-machine interaction. The combined spectral and differenced prosody features are considered for the task of the emotion recognition in the first stage. The task of emotion recognition does not serve the sole purpose of improvement in the performance of an ASR system. Based on the recognized emotions from the input speech, the corresponding adapted emotive ASR model is selected for the evaluation in the second stage. This adapted emotive ASR model is built using the existing neutral and synthetically generated emotive speech using prosody modification method. In this work, the importance of emotion recognition block at the front-end along with the emotive speech adaptation to the ASR system models were studied. The speech samples from IIIT-H Telugu speech corpus were considered for building the large vocabulary ASR systems. The emotional speech samples from IITKGP-SESC Telugu corpus were used for the evaluation. The adapted emotive speech models have yielded better performance over the existing neutral speech models.

  相似文献   

18.
基于凌阳SPCE061A单片机的语音识别系统设计   总被引:2,自引:0,他引:2  
刘萌  郑煊 《电子测试》2008,(7):65-68
本文以凌阳公司生产的16位单片机SPCE061A为核心处理器,利用其适用于数字语音识别的特点,设计了一套基于线性预测倒谱和动态时间规整技术(DTW)的特定人孤立词语音识别系统,对系统的硬件电路和软件设计进行了分析.该系统能进行语音指令的识别并作出相应的应答.该系统可以应用在一些智能控制领域,能够大大改善人机交互界面.经检验,指令识别的准确率达到80%.该系统结构简单,具有很高的性价比,便于推广和应用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号