首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
汉语语音理解系统的任务之一是把语音识别系统获得的汉语音节转换成正确的汉字,与汉语语音识别系统一起,完成一个语音-文本(SpeechtoText)的转换系统。本文利用一个有别于语音理解传统方法(1.语言学方法[1],2.统计学方法[2])的新的反馈式语音理解方案进行汉语地名的识别理解,获得了很好的实验结果。本文最后对实验结果和反馈式语音识别理解方案进行了讨论。  相似文献   

2.
汉语语音理解系统的任务之一是把语音识别系统获得的汉语单音节转换成正确的汉字、词,乃至汉语的短语、语句,与语音识别系统一起,完成一个语音到文本(speech to text)的转换系统。本文利用一个闭环反馈方式汉语语音识别理解方案,在汉语词识别理解的基础上,进一步实现对汉语结构性短语的识别理解,获得了预期的结果。最后本文对实验结果和反馈式语音识别理解方案进行了讨论。  相似文献   

3.
数字信号处理(DSP)技术的迅速发展,为语音实识别的实时实现提供了可能.本文尝试采用TI公司新型号的DSP芯片,建立一个汉语数字的语音实时识别系统,实验蛄果表明,该系统基本能实现预期识别目标.  相似文献   

4.
语音识别与理解的研究进展   总被引:1,自引:0,他引:1  
本文综述了当前语音识别理解的发展趋势和最新进展。指出美国在不依说话人的大词汇表的连续语音隐马尔柯夫模型识别方面起主导地位,日本在大词汇表的连续语音神经网络识别、模拟人工智能进行语音后处理方面起主导地位,并介绍了国际上最优秀的语音识别理解系统。  相似文献   

5.
应用于语音识别片上系统的语音检测算法   总被引:2,自引:0,他引:2  
语音识别技术的研究已经进入实用化阶段,而实用化语音识别系统中的一个关键技术就是可靠的语音检测。本文提出了一种基于有限状态机模型的实时语音检测算法(FSM-SD)。采用对数最大似然判决帧能量检测器和过零率检测器控制各状态之间的跳转关系。针对语音识别中的MFCC(Mel频标倒谱系数)和LPCC(线性预测倒谱参数)特征提取过程,分别得到两种不同的帧能量计算方法。将FSM-SD应用到在OAK DSP上实现的小词表汉语语音识别系统,通过实验验证了其对系统识别性能和噪声稳健性的有效保证。  相似文献   

6.
一种面向语音识别的新型神经网络   总被引:1,自引:0,他引:1  
提出了一种新型神经网络模型,描述了该网络的工作原理和训练方法以及识别算法。为克服神经网络对时序信号建模能力差的缺点,引入了非线性分段处理和代表帧特征提取方法。最后介绍了根据这一模型所设计的一个汉语语音识别系统,试验表明该网络在汉语语音识别方面具有较大的潜力。  相似文献   

7.
语音识别技术及应用(下)   总被引:3,自引:0,他引:3  
语音识别系统分类与应用 语音识别系统可以根据对输入语音的限制加以分类。表1列出各种系统的分类比较。从表中可以看出,如果从说话者与识别系统的相关性考虑,可以将识别系统分为3类:(1)特定人语音识别系统:仅考虑对于专人的话音进行识别;(2)非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习;(3)多人的识别系统:通常能识别一组人的语音,  相似文献   

8.
基于ANN的汉语数字语音识别   总被引:1,自引:0,他引:1  
本文介绍了在语音识别中使用人工神经网络构成识别系统的新方法,分析了它与传统识别方法的不同及优越性,并以BP网络构成不定人汉语数字语音识别器,通过计算机模拟实验表明,勘误别性能明显优于同样条件下HMM识别器,证明了用ANN进行语音识别是一种具吸引力有发展前途的新方法。  相似文献   

9.
讨论了欧洲电信标准委员会ETSI提出的分布式语音识别系统的抗噪前端特征提取算法,该算法融合多种抗噪技术。结合汉语语音的特点,进行了汉语语音识别整体框架下的算法实现,并进行了实验和分析,典型噪声环境下的识别结果证明,相对于基线MFCC特征提取算法,稳健性有较大提高。  相似文献   

10.
本文从语音状态驻留长度分布出发,建立了一个非齐次隐含马尔可夫(Markov)语音识别模型。这个模型更接近语音信号物理实际,训练和识别的时间、空间复杂性比经典的HMM模型有很大的改进。文中描述了新模型的训练和识别算法,介绍了根据这一模型所设计的一个汉语孤立字全字表的实时识别和理解系统。  相似文献   

11.
语音识别算法的确定与实现   总被引:1,自引:0,他引:1  
在语音识别的实验中,对几种算法方案进行了比较、分析和择优淘劣,标准是在一定词汇量的条件下,权衡占用机器的内存空间、(正确)识别率和响应速度。力争使与话者有关的单词语音识别系统的设计达到优化,取得满意的结果。本文即是此项实验的总结。  相似文献   

12.
基于线性网络的孤立词识别系统识别时间与词表规模成正比,识别性能严重受限于词表的规模.根据汉语孤立词特点,提出了一种基于连续识别的大词表孤立词识别系统.该系统围绕嵌入式识别所关注的速度和内存消耗性能,采用先实现应用多级搜索、定点化策略的连续识别,再对连续识别的识别结果进行音字转换处理的方法,将连续语音识别应用于大词表孤立...  相似文献   

13.
汉语大词汇量连续语音识别系统研究进展   总被引:34,自引:3,他引:34  
刘加 《电子学报》2000,28(1):85-91
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论.  相似文献   

14.
语音识别的研究与进展   总被引:1,自引:0,他引:1  
本文综合阐述了当前语音识别研究及语音识别系统的状况,并对该领域的研究及向未来发展做了展望。  相似文献   

15.
语音识别系统在语音识别中自我判定识别结果,并从错误中自动获取经验改正错误实现知识的自我完善具有重要意义。采用人工神经网络可以有效学习与更新知识,人工神经网络与语音识别结果自动检验方法结合实现一种新的有效学习与更新系统。在该系统中采用基于LEA判别法的梯度牛顿有效结合神经网络快速学习方法。该系统实现在语音识别实践中能够自学习并提高识别率,具有一定的智能。文中给出系统原理图和实验结果。  相似文献   

16.
《现代电子技术》2016,(16):151-154
数字语音录制过程中存在的环境、用户口音和非目标词汇等干扰,使以往开发出的无线通信数字语音识别系统准确性较低、可移植性较差。因此,对无线通信的数字语音识别系统进行优化设计,设计系统的核心元件为C6727DSP芯片、QGDH710语音识别芯片和CC2520射频收发器。C6727DSP芯片进行数字语音的前期处理工作;QGDH710语音识别芯片对处理后的数字语音进行识别,并将其识别出的指令反馈到CC2520射频收发器;CC2520射频收发器进行指令的格式转换工作,并将指令传输到用户无线通信设备中,最终实现数字语音识别系统在无线通信中的有效利用。为了方便用户进行系统操作,软件给出用户无线通信设备虚拟功能图。经实验验证可知,该设计系统准确性较高,具有高度可移植性。  相似文献   

17.
欧智坚  王作英 《电子学报》2003,31(4):608-611
尽管作为当前最为流行的语音识别模型, HMM由于采用状态输出独立同分布假设,忽略了对语音轨迹动态特性的描述.本文基于一个更为灵活的语音描述统计框架—广义DDBHMM,提出了一个具体的多项式拟合语音轨迹模型,以及新的训练和识别算法,更好地刻划了真实的语音特性.本文还给出了一种有效的剪枝算法,得到一个实用化模型.汉语大词汇量非特定人连续语音识别的实验表明,这种剪枝的多项式拟合语音轨迹模型以较少的计算量明显改善了识别系统的性能.  相似文献   

18.
大多数实际应用环境中总是存在各种各样的噪声,由于训练环境与识别环境不匹配,现有的绝大多数说话人识别系统在噪声环境中的性能都不可避免的急剧下降。为了让说话人识别系统在强噪声环境中,有较好的识别效果.研究一个将语音增强器和说话人识别系统级连起来的系统,该系统中将语音增强作为前端处理来提高输入的信噪比。实验证明,该系统具有很好的抗噪声性能。  相似文献   

19.
周峰  俞一彪 《信号处理》2017,33(9):1215-1220
汉语数字语音之间的高混淆性直接影响了汉语数字语音识别的效果,传统的语音识别方法很难对易混淆的语音做出有效的区分。本文提出了一种多参数、多级识别策略,先采用MEL谱参数基于HMM进行初级数字语音识别,然后对易混淆的数字对采用一种新的群延时谱参数——RRCGD-CC(Reflected Roots Chirp Group Delay-Cepstral Coefficients)基于SVM进行二次分类。实验结果表明,通过多参数多级识别方法,数字“2”和“8”的识别率提高了8%,数字识别系统的整体识别率提高了2.3%。这一结果充分说明了本文提出的多参数多级识别方法有利于提高汉语数字语音识别系统的识别性能,同时也说明了RRCGD-CC在易混淆数字语音的识别上是有效的。   相似文献   

20.
《现代电子技术》2017,(15):137-140
英语语音智能识别系统的发展方向是在线、连续性的人机交互,为此,设计在线连续交互式英语语音智能识别系统,并基于梅尔频率倒谱系数设计语音识别函数。系统的参考数据库选取NOSE算法计算语音评价分数并查错,利用专家知识库纠正用户英语语音。系统由语音训练模块和在线连续交互式识别模块组成,前者为系统数据库提供英语语音的语料、音标资源,后者实施系统数据库的评价、纠正工作。实验结果证明设计的系统语音识别率高且识别时间短,有效性强。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号