共查询到17条相似文献,搜索用时 93 毫秒
1.
汉语连续语音中声调识别的特殊性研究 总被引:1,自引:0,他引:1
大词汇连续语识别是当前语音识别研究的主流,探讨其中声调识别的特殊是一项有意义的工作,本文从声调获取,语音分割,声调模式和声调识别等进行了研究,通过对现有研究成果的分析和总结,并结合自己的研究工作,得出了若干结论,提出了基于音节的连续语音声调识别思想。 相似文献
2.
在汉语语音识别中应用声调信息的研究 总被引:6,自引:0,他引:6
声调信息在汉语普通话语音识别系统中,具有非常重要的意义。文章实现了声调特征提取的算法,并主要研究了如何应用这些特征,才能最大限度地发挥声调信息的作用,提高识别系统的性能。实验结果表明,声调特征可以和识别系统原有的特征很好地结合,合理应用声调信息能有效地提高识别系统的性能,系统的误识率下降了22.26%。 相似文献
3.
提出从特征提取参数、模型参数对隐马尔可夫声调模型进行区分型训练,来提高声调识别率;提出模型相关的权重对谱特征模型和声调模型的概率进行加权,并根据最小音子错误区分性目标函数对权重进行训练,来提高声调模型加入连续语音识别时的性能。声调识别实验表明区分性的声调模型训练以及特征提取方法显著提高了声调识别率。区分性模型权重训练能够在声调模型加入之后进一步连续语音识别系统的识别率。 相似文献
4.
5.
6.
汉语孤立字声调的模糊识别方法 总被引:1,自引:0,他引:1
本文应用模糊集合来识别汉语孤立字的声调。孤独字的四声调可被描述成四种模式类的模糊集合。由于四声调的基音轮廓具有其固定模式, 因之在此基础上可构成模糊集合的隶属函数。方法中使用隶属函数为模式分类的判别函数。这些隶属函数既简单又易于计算, 故适宜实时执行。实验结果表明, 总的识别率高于99%。 相似文献
7.
8.
计算机能听懂人的语言,这意味着人工智能时代已向我们走来c北京中自汉王科技公司在IBM支持下,基于ViaVoice自行开发的一种最新语音识别软件与手写输入系统——汉王听写系统,它把IBM研究开发的语音识别核心技术与汉三优秀的手写汉字识别输入系统完美的集成在一起.形成了一个优势互补的非键盘输入系统。成为一种简单方便,人人会用的文字录入工具。这不仅提高了汉字输入速度,而且使讲话人更自然、更流畅地表达自己的意愿。汉王听写系统,具有汉语语音听写输入、语音命令、编辑、打印功能,基于中文自身的特点,同音字多,有声调、词… 相似文献
9.
1.引言 人工神经网络模型是由大量的简单计算单元广泛相互连接而成的具有高度并行处理能力的复杂系统,它是一种非线性系统,具有高度的自组织能力,它的整体性能并不是各个单元的简单迭加,而表现为整个网络的复杂的有组织的集体行为;它的大规模的并行处理和广泛的连接使得其储存的知识和信息分布在网络中各神经元的连接强度中,提供了很高程度的鲁棒性和容错能力;它还能够不断地调整网络中各神经元的连接强度以改 相似文献
10.
11.
12.
简要地介绍了用于语音分析合成的时城基音同步叠加算法,在此基础上提出一种汉语语音时域声调转换方法。利用这种方法可以将一种声调的语音转换为另一种声调的语音,除微小的音质降低外,仍可保持较好的语音质量。这种方法直接对语音波形进行处理,具有计算简单、能在一般微型计算机上进行实时的特点。将之用于语音合成系统,可以通过相同声韵母的音节只存储一种声调的语音数据而大大降低音库的容量;用这种方法按照汉语语句的语调变化规律来合成语句,还可以较好地改善汉语语句合成的自然度. 相似文献
13.
基于两级BP模型的普通话声调识别系统 总被引:1,自引:2,他引:1
普通话声调识别参数除常用的基音轮廓外,基音的一阶差分、能量及能量的一阶差分等也具一定的声调特征。实验结果表明:如果将各种参数同时作为一个BP模型的输入参数,声调识别率不但没有提高,反而显著下降,因此,该文提出了将各种参数分别训练一个各自的BP网络,再将这些网络的输出作为另一高层BP网络的输入的普通话声调识别方法。另外,针对上声的特点提出了一种改进的基音平滑算法。这些方法的运用使系统的声调识别率达到90.05%。 相似文献
14.
数据挖掘在音高变化规律学习中的应用 总被引:1,自引:0,他引:1
音高变化规律对合成高自然度的语音非常重要.为了提取音高即基频的变化规律,设计实现了数据挖掘系统SpeechDM,经过训练取得了较好的学习结果.该文介绍了国内进行的关于音高变化规则的研究情况以及数据挖掘技术,给出SpeechDM的系统结构,并介绍其主要模块,对实验结果进行了分析. 相似文献
15.
文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法:在音频和视频集成建模方面,使用多数据流HMM来反映语音的双模型特性。识别实验表明,文中建立的音频视频连续语音识别系统具有很好的抗噪性。 相似文献
16.
杨嵩 《计算机与数字工程》2012,40(4):35-38
HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成以及字符识别等领域。文章在详细介绍了语音识别的过程、原理及相关概念的基础之上,介绍了HTK的基本原理和软件结构,以及使用HTK完成语音识别任务的整个过程。最后,讨论声学单元等一系列的模型参数的选择,使用HTK搭建一个简单连续汉语语音输入系统。 相似文献
17.
具有确定词表的词组语音识别是语音识别研究的一个重要方面,应用相当广泛。本文在简单介绍词组语音识别之后给出了一个基于连续语音识别算法和词树约束的汉语词组语音识别方法。这种方法通过在束搜索连续语音识别算法中引入词树约束信息,发挥了连续语音识别算法的优点,并且充分利用了确定词表的约束信息,提高了计算和搜索的效率。然后介绍了约束词树和它的高效存储结构,这种结构提高了约束词树的存储效率和在识别搜索中的检索效率;最后给出实验的结果和讨论并进行简要的总结。 相似文献