共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
汉语语音理解系统的任务之一是把语音识别系统获得的汉语单音节转换成正确的汉字、词,乃至汉语的短语、语句,与语音识别系统一起,完成一个语音到文本(speech to text)的转换系统。本文利用一个闭环反馈方式汉语语音识别理解方案,在汉语词识别理解的基础上,进一步实现对汉语结构性短语的识别理解,获得了预期的结果。最后本文对实验结果和反馈式语音识别理解方案进行了讨论。 相似文献
3.
4.
语音识别与理解的研究进展 总被引:1,自引:0,他引:1
本文综述了当前语音识别理解的发展趋势和最新进展。指出美国在不依说话人的大词汇表的连续语音隐马尔柯夫模型识别方面起主导地位,日本在大词汇表的连续语音神经网络识别、模拟人工智能进行语音后处理方面起主导地位,并介绍了国际上最优秀的语音识别理解系统。 相似文献
5.
应用于语音识别片上系统的语音检测算法 总被引:2,自引:0,他引:2
语音识别技术的研究已经进入实用化阶段,而实用化语音识别系统中的一个关键技术就是可靠的语音检测。本文提出了一种基于有限状态机模型的实时语音检测算法(FSM-SD)。采用对数最大似然判决帧能量检测器和过零率检测器控制各状态之间的跳转关系。针对语音识别中的MFCC(Mel频标倒谱系数)和LPCC(线性预测倒谱参数)特征提取过程,分别得到两种不同的帧能量计算方法。将FSM-SD应用到在OAK DSP上实现的小词表汉语语音识别系统,通过实验验证了其对系统识别性能和噪声稳健性的有效保证。 相似文献
6.
一种面向语音识别的新型神经网络 总被引:1,自引:0,他引:1
提出了一种新型神经网络模型,描述了该网络的工作原理和训练方法以及识别算法。为克服神经网络对时序信号建模能力差的缺点,引入了非线性分段处理和代表帧特征提取方法。最后介绍了根据这一模型所设计的一个汉语语音识别系统,试验表明该网络在汉语语音识别方面具有较大的潜力。 相似文献
7.
语音识别技术及应用(下) 总被引:3,自引:0,他引:3
语音识别系统分类与应用 语音识别系统可以根据对输入语音的限制加以分类。表1列出各种系统的分类比较。从表中可以看出,如果从说话者与识别系统的相关性考虑,可以将识别系统分为3类:(1)特定人语音识别系统:仅考虑对于专人的话音进行识别;(2)非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习;(3)多人的识别系统:通常能识别一组人的语音, 相似文献
8.
基于ANN的汉语数字语音识别 总被引:1,自引:0,他引:1
本文介绍了在语音识别中使用人工神经网络构成识别系统的新方法,分析了它与传统识别方法的不同及优越性,并以BP网络构成不定人汉语数字语音识别器,通过计算机模拟实验表明,勘误别性能明显优于同样条件下HMM识别器,证明了用ANN进行语音识别是一种具吸引力有发展前途的新方法。 相似文献
9.
10.
本文从语音状态驻留长度分布出发,建立了一个非齐次隐含马尔可夫(Markov)语音识别模型。这个模型更接近语音信号物理实际,训练和识别的时间、空间复杂性比经典的HMM模型有很大的改进。文中描述了新模型的训练和识别算法,介绍了根据这一模型所设计的一个汉语孤立字全字表的实时识别和理解系统。 相似文献
11.
语音识别算法的确定与实现 总被引:1,自引:0,他引:1
在语音识别的实验中,对几种算法方案进行了比较、分析和择优淘劣,标准是在一定词汇量的条件下,权衡占用机器的内存空间、(正确)识别率和响应速度。力争使与话者有关的单词语音识别系统的设计达到优化,取得满意的结果。本文即是此项实验的总结。 相似文献
12.
13.
汉语大词汇量连续语音识别系统研究进展 总被引:34,自引:3,他引:34
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论. 相似文献
14.
15.
语音识别系统在语音识别中自我判定识别结果,并从错误中自动获取经验改正错误实现知识的自我完善具有重要意义。采用人工神经网络可以有效学习与更新知识,人工神经网络与语音识别结果自动检验方法结合实现一种新的有效学习与更新系统。在该系统中采用基于LEA判别法的梯度牛顿有效结合神经网络快速学习方法。该系统实现在语音识别实践中能够自学习并提高识别率,具有一定的智能。文中给出系统原理图和实验结果。 相似文献
16.
《现代电子技术》2016,(16):151-154
数字语音录制过程中存在的环境、用户口音和非目标词汇等干扰,使以往开发出的无线通信数字语音识别系统准确性较低、可移植性较差。因此,对无线通信的数字语音识别系统进行优化设计,设计系统的核心元件为C6727DSP芯片、QGDH710语音识别芯片和CC2520射频收发器。C6727DSP芯片进行数字语音的前期处理工作;QGDH710语音识别芯片对处理后的数字语音进行识别,并将其识别出的指令反馈到CC2520射频收发器;CC2520射频收发器进行指令的格式转换工作,并将指令传输到用户无线通信设备中,最终实现数字语音识别系统在无线通信中的有效利用。为了方便用户进行系统操作,软件给出用户无线通信设备虚拟功能图。经实验验证可知,该设计系统准确性较高,具有高度可移植性。 相似文献
17.
18.
大多数实际应用环境中总是存在各种各样的噪声,由于训练环境与识别环境不匹配,现有的绝大多数说话人识别系统在噪声环境中的性能都不可避免的急剧下降。为了让说话人识别系统在强噪声环境中,有较好的识别效果.研究一个将语音增强器和说话人识别系统级连起来的系统,该系统中将语音增强作为前端处理来提高输入的信噪比。实验证明,该系统具有很好的抗噪声性能。 相似文献
19.
汉语数字语音之间的高混淆性直接影响了汉语数字语音识别的效果,传统的语音识别方法很难对易混淆的语音做出有效的区分。本文提出了一种多参数、多级识别策略,先采用MEL谱参数基于HMM进行初级数字语音识别,然后对易混淆的数字对采用一种新的群延时谱参数——RRCGD-CC(Reflected Roots Chirp Group Delay-Cepstral Coefficients)基于SVM进行二次分类。实验结果表明,通过多参数多级识别方法,数字“2”和“8”的识别率提高了8%,数字识别系统的整体识别率提高了2.3%。这一结果充分说明了本文提出的多参数多级识别方法有利于提高汉语数字语音识别系统的识别性能,同时也说明了RRCGD-CC在易混淆数字语音的识别上是有效的。 相似文献