共查询到19条相似文献,搜索用时 62 毫秒
1.
本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可夫依赖关系,提出了描述语音信号这种正反向依赖关系的正反隐马可夫模型,并实验证明了仅仅利用语音反向依赖关系语音识别同样也能获得相当可观的识别性能。 相似文献
2.
正反向隐马尔可夫模型及其在连续语音识别中的应用 总被引:1,自引:0,他引:1
本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用语音反向依赖关系语音识别同样也能获得相当可观的识别性能。接着,本文针对孤立字和连续语音两种不同的识别任务,研究了在语音识别中同时利用这两种依赖信息的方法,并提出了一种连续语音识别中的新的搜索算法──正反向分半混合搜索。这种方法利用基于正向HMM的正向Viterbi搜索和基于反向HMM的反向Viterbi搜索的中间结果来有效地结合正反向依赖信息,实验证明正反向分半混合搜索方法确实一致地优于单用任何一种依赖信息的单向搜索识别方法。 相似文献
3.
《卫星电视与宽带多媒体》2011,(7):36-39
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 相似文献
4.
HMM连续语音识别中Viterbi算法的优化及应用 总被引:5,自引:0,他引:5
基于HMM连续语音识别系统声学层的最佳路径识别算法有很多种 ,其中Viterbi算法在CPU时间、存储量及实施方面性能都较为优越 ,是在实际应用中经常采用的方法之一。但它还不直接适用于实时系统 ,其算法压力仍是影响整个系统效率的瓶颈问题。文章就此提出了该算法的两种改进 ,Viterbi Bear与Viterbi Window ,以提高解码效率。试验表明 ,在合适的参数选择之下 ,采用Viterbi Beam ,解码时间缩短为基带系统的 4 7.3% ,识别错误率仅上升了 8.5% ;而Viterbi Window甚至可以在不影响识别精度的前提下将解码时间缩短为原来的 36.2 %。文章最后还列举了这一技术的诸多应用。 相似文献
5.
6.
基于HMM/VQ的认人的中等词表连续语音识别 总被引:2,自引:2,他引:0
本文讨论基于隐马尔可夫模型(HMM)和矢量量化(VQ)的连续语音识别方法。用这种方法,对每个单词作成一个HMM,对多个模型组合成的状态转移网络搜索其状态转移的最佳路径,从而实现不预先进行单词切分的连续语音的识别,使用有限态文法约束及其它一些改善识别性能的措施,演示系统能识别特定人的18种英语句式,150个单词,用312个话句(共有2710个单词)进行测试,识别延迟时间为发音时长的62%,发音速度平均为每秒2.32个单词,单词识准率为97.3%。 相似文献
7.
给出了一种应用于电话语音自动拨号的实时语音识别方法。该系统对特定人的语音进行识别,并将识别结果映射成相应的电话号码。实验结果表明该方法具有很高的识别精度和实时的识别速度,并且只需很小的内存空间就可以实现,是一种有效的应用于电话语音自动拨号等方面的语音识别方法。 相似文献
8.
9.
10.
11.
本文首先分析了以PC机作为宿主机的半导体神经网络处理机CASSANDRA-I,进一步介绍了新的半导体神经计算机CASSANDRA-II的系统实现和功能特性,并将其应用到问候语语音识别中,实验结果表明CASSANDRA-II神经计算机识别结果优于HMM模型的识别结果. 相似文献
12.
详细介绍了一种基于EBF神经网络的特定人语音识别方法。提出了该语音识别方法在媒体资产管理系统上的应用并给出详细的工作流程图。采用LPC和MFCC2种特征分别建立系统,并对2个系统的识别性能作比较后进行融合。 相似文献
13.
设计并实现利用语音识别对多媒体信息检索的系统。该系统综合运用分类法.主题法和基于内容的多媒体检索方法,并嵌入语音识别技术。以达到综合运用多媒体低级内容特征和高级语义特征来提高检索性能的目的,同时使得人机交互更为便利。 相似文献
14.
耳语音识别可应用于国家安全的某些特殊需要。运用双门限法对语音样本进行端点检测,通过实验分别找出短时能量、短时过零率的高低门限4个参数的最佳取值。深入分析研究参数的抗噪问题,在MFCC参数中引入短时能量、一阶差分、二阶差分等参数,增强MFCC的抗噪性。研究表明,在隐马尔可夫模型中,MFCC和LPCC联合运用讨论识别效果要远优于独立参数。 相似文献
15.
本文简要讨论了在基于HMM的连续语音识别系统中怎样选取基本语音单元的问题,介绍了在欧洲Polyglot课题下在法国LINSI-CNRS建立的基于上下文无关音素HMM。然后,本文详细给出了利用左或右上下文相关音素HMM,作者对上述系统改进后进行的连续语音识别,有用美国语音库DARPA-RM1,在不考虑句法信息时,我们获得了连续时词识别率大约3-10个百分点的明显提高。实验是在法国LIMSI-CNRS 相似文献
16.
17.
18.
汉语大词汇量连续语音识别系统研究进展 总被引:34,自引:3,他引:34
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论. 相似文献