首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
王仁华  江辉 《电子学报》1996,24(10):63-68
本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可夫依赖关系,提出了描述语音信号这种正反向依赖关系的正反隐马可夫模型,并实验证明了仅仅利用语音反向依赖关系语音识别同样也能获得相当可观的识别性能。  相似文献   

2.
正反向隐马尔可夫模型及其在连续语音识别中的应用   总被引:1,自引:0,他引:1  
本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用语音反向依赖关系语音识别同样也能获得相当可观的识别性能。接着,本文针对孤立字和连续语音两种不同的识别任务,研究了在语音识别中同时利用这两种依赖信息的方法,并提出了一种连续语音识别中的新的搜索算法──正反向分半混合搜索。这种方法利用基于正向HMM的正向Viterbi搜索和基于反向HMM的反向Viterbi搜索的中间结果来有效地结合正反向依赖信息,实验证明正反向分半混合搜索方法确实一致地优于单用任何一种依赖信息的单向搜索识别方法。  相似文献   

3.
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。  相似文献   

4.
HMM连续语音识别中Viterbi算法的优化及应用   总被引:5,自引:0,他引:5  
袁俊 《电子技术》2001,28(2):48-51
基于HMM连续语音识别系统声学层的最佳路径识别算法有很多种 ,其中Viterbi算法在CPU时间、存储量及实施方面性能都较为优越 ,是在实际应用中经常采用的方法之一。但它还不直接适用于实时系统 ,其算法压力仍是影响整个系统效率的瓶颈问题。文章就此提出了该算法的两种改进 ,Viterbi Bear与Viterbi Window ,以提高解码效率。试验表明 ,在合适的参数选择之下 ,采用Viterbi Beam ,解码时间缩短为基带系统的 4 7.3% ,识别错误率仅上升了 8.5% ;而Viterbi Window甚至可以在不影响识别精度的前提下将解码时间缩短为原来的 36.2 %。文章最后还列举了这一技术的诸多应用。  相似文献   

5.
胡丹  曾庆宁  龙超  黄桂敏 《电视技术》2015,39(24):43-46
针对大词汇量连续语音识别中识别率不高的问题,提出了将语音增强级联在识别系统前端,在语音增强中将谱减法和对数最小均方误差算法(logmmse)与用于噪声估计的最小控制递归平均算法(imcra)相结合。识别系统使用Mel频率倒谱系数(MFCC)提取特征,用隐马尔科夫模型(HMM)训练与识别。实验结果表明,提出的方法最高能使单词识别率提高38.9%,使句子正确率提高21.8%。该方法用于大词汇量连续语音识别是可行的,有效的。  相似文献   

6.
基于HMM/VQ的认人的中等词表连续语音识别   总被引:2,自引:2,他引:0  
本文讨论基于隐马尔可夫模型(HMM)和矢量量化(VQ)的连续语音识别方法。用这种方法,对每个单词作成一个HMM,对多个模型组合成的状态转移网络搜索其状态转移的最佳路径,从而实现不预先进行单词切分的连续语音的识别,使用有限态文法约束及其它一些改善识别性能的措施,演示系统能识别特定人的18种英语句式,150个单词,用312个话句(共有2710个单词)进行测试,识别延迟时间为发音时长的62%,发音速度平均为每秒2.32个单词,单词识准率为97.3%。  相似文献   

7.
卢玮  姜晔 《电声技术》2001,(2):30-32
给出了一种应用于电话语音自动拨号的实时语音识别方法。该系统对特定人的语音进行识别,并将识别结果映射成相应的电话号码。实验结果表明该方法具有很高的识别精度和实时的识别速度,并且只需很小的内存空间就可以实现,是一种有效的应用于电话语音自动拨号等方面的语音识别方法。  相似文献   

8.
全音节连续汉语语音识别的研究   总被引:3,自引:0,他引:3  
在大词汇量连续汉语语音识别的研究中,我们根据汉语语音自身的特点,选用全音节作为识别单元,与音对文法相结合,以期达到实现大词汇量语音识别的目的.实现连续语音识别时,不需预先切分音节,而使用帧同步型网络搜索算法并在搜索中予以音长控制,用180句未训练过的任意词组成的无文本约束的连续语句对系统进行测试评估,获得了40.40%的音节识别率.  相似文献   

9.
给出了一种应用于电话语音自动拨号的实时语音识别方法。该系统对特定人的语音进行识别,并将识别结果映射成相应的电话号码。实验结果表明该方法具有很高的识别精度和实时的识别速度,并且只需很小的内存空间就可以实现,是一种有效的应用于电话语音自动拨号等方面的语音识别方法。  相似文献   

10.
文章介绍了一种将语音识别技术应用在电动玩具摩托车中的方法 ,此方法使玩具摩托车能够识别人的语音命令 ,并能完成各种相应的动作 ,识别率在 92 %以上。  相似文献   

11.
王守觉  曹文明 《电子学报》2006,34(2):267-271
本文首先分析了以PC机作为宿主机的半导体神经网络处理机CASSANDRA-I,进一步介绍了新的半导体神经计算机CASSANDRA-II的系统实现和功能特性,并将其应用到问候语语音识别中,实验结果表明CASSANDRA-II神经计算机识别结果优于HMM模型的识别结果.  相似文献   

12.
详细介绍了一种基于EBF神经网络的特定人语音识别方法。提出了该语音识别方法在媒体资产管理系统上的应用并给出详细的工作流程图。采用LPC和MFCC2种特征分别建立系统,并对2个系统的识别性能作比较后进行融合。  相似文献   

13.
设计并实现利用语音识别对多媒体信息检索的系统。该系统综合运用分类法.主题法和基于内容的多媒体检索方法,并嵌入语音识别技术。以达到综合运用多媒体低级内容特征和高级语义特征来提高检索性能的目的,同时使得人机交互更为便利。  相似文献   

14.
耳语音识别可应用于国家安全的某些特殊需要。运用双门限法对语音样本进行端点检测,通过实验分别找出短时能量、短时过零率的高低门限4个参数的最佳取值。深入分析研究参数的抗噪问题,在MFCC参数中引入短时能量、一阶差分、二阶差分等参数,增强MFCC的抗噪性。研究表明,在隐马尔可夫模型中,MFCC和LPCC联合运用讨论识别效果要远优于独立参数。  相似文献   

15.
谢锦辉 《通信学报》1994,15(2):83-87
本文简要讨论了在基于HMM的连续语音识别系统中怎样选取基本语音单元的问题,介绍了在欧洲Polyglot课题下在法国LINSI-CNRS建立的基于上下文无关音素HMM。然后,本文详细给出了利用左或右上下文相关音素HMM,作者对上述系统改进后进行的连续语音识别,有用美国语音库DARPA-RM1,在不考虑句法信息时,我们获得了连续时词识别率大约3-10个百分点的明显提高。实验是在法国LIMSI-CNRS  相似文献   

16.
语音信号的Bark子波变换及其在语音识别中的应用   总被引:16,自引:1,他引:16       下载免费PDF全文
付强  易克初 《电子学报》2000,28(10):102-105
本文首先在语音感知实验基础上所得到的Bark尺度概念与子波的构造联系起来,提出了一种语音信号Bark子波及其变换.在感知特性中,它与人耳的听觉系统是直接吻合的:在数学上,它是一种非正交的但却是超完备的,可逆且是自反演的子波变换.应用在语音识别中时,利用子波的局部基性质,取较小的分析帧长,提高了前端处理的时间分辨率.实验表明,所形成的新特征在对辅音区别能力方面明显优于目前应用于广泛的MFCC特征.  相似文献   

17.
分布式语音识别的前端处理及相关标准   总被引:1,自引:1,他引:0  
语音识别在实际应用中受到信道噪声和便携终端计算、存储能力不足等因素制约。分布式语音识别(DSR)不仅解决了上述的问题,还有占用带宽窄、综合成本低等优点,但其应用的前提是提取的参数必须标准化。文中介绍了分布式语音识别前端处理的基本结构以及相关标准。  相似文献   

18.
汉语大词汇量连续语音识别系统研究进展   总被引:34,自引:3,他引:34  
刘加 《电子学报》2000,28(1):85-91
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论.  相似文献   

19.
徐向华  朱杰  郭强 《信号处理》2004,20(5):497-500
针对汉语语音单音节结构的特点,考虑音节间协同发音的现象,本文提出了一种对三音子模型进行分级聚类的方法。与传统的基于决策树的状态聚类算法相比,该方法通过对稀少三音子模型聚类,更充分地利用训练数据,减少稀少三音子对状态聚类的影响,从而提高声学模型的鲁棒性。实验结果表明:大词汇量连续语音识别器采用这种分级聚类方法,不仅可以大大减少模型及其参数的数量,还可使系统识别率有所提高,其中误识率相对于传统的决策树状态聚类系统降低了4.93%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号