首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
汉语连续语音中声调识别的特殊性研究   总被引:1,自引:0,他引:1  
大词汇连续语识别是当前语音识别研究的主流,探讨其中声调识别的特殊是一项有意义的工作,本文从声调获取,语音分割,声调模式和声调识别等进行了研究,通过对现有研究成果的分析和总结,并结合自己的研究工作,得出了若干结论,提出了基于音节的连续语音声调识别思想。  相似文献   

2.
在汉语语音识别中应用声调信息的研究   总被引:6,自引:0,他引:6  
声调信息在汉语普通话语音识别系统中,具有非常重要的意义。文章实现了声调特征提取的算法,并主要研究了如何应用这些特征,才能最大限度地发挥声调信息的作用,提高识别系统的性能。实验结果表明,声调特征可以和识别系统原有的特征很好地结合,合理应用声调信息能有效地提高识别系统的性能,系统的误识率下降了22.26%。  相似文献   

3.
汉语语音识别中的区分性声调建模方法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出从特征提取参数、模型参数对隐马尔可夫声调模型进行区分型训练,来提高声调识别率;提出模型相关的权重对谱特征模型和声调模型的概率进行加权,并根据最小音子错误区分性目标函数对权重进行训练,来提高声调模型加入连续语音识别时的性能。声调识别实验表明区分性的声调模型训练以及特征提取方法显著提高了声调识别率。区分性模型权重训练能够在声调模型加入之后进一步连续语音识别系统的识别率。  相似文献   

4.
支持向量机的汉语连续语音声调识别方法   总被引:1,自引:1,他引:1  
声调信息在汉语语音识别中具有非常重要的意义。采用支持向量机对连续汉语连续语音进行声调识别实验,首先采用基于Teager能量算子和过零率的两级判别策略对连续语音进行浊音段提取,然后建立了适合于支持向量机分类模型的等维声调特征向量。使用6个二类SVM模型对非特定人汉语普通话的4种声调进行分类识别,与BP神经网络相比,支持向量机具有更高的识别率。  相似文献   

5.
晁浩  杨占磊  刘文举 《计算机应用》2013,33(10):2939-2944
发音特征表征了语音的发音方式信息,能够辅助传统的韵律特征改善声调建模的精度。在分析汉语声韵母发音特点的基础上,将发音方式划分为19类,并提出利用阶层式多层感知器计算语音信号属于各类的后验概率,作为发音特征。之后,将发音特征与传统的韵律特征一起用于声调建模。实验结果显示,加入发音特征后,在三种不同的建模方法下声调识别的准确率提升约5%。将声调模型融入大词表连续语音识别系统后,汉字错误率有了明显的下降  相似文献   

6.
汉语孤立字声调的模糊识别方法   总被引:1,自引:0,他引:1  
本文应用模糊集合来识别汉语孤立字的声调。孤独字的四声调可被描述成四种模式类的模糊集合。由于四声调的基音轮廓具有其固定模式, 因之在此基础上可构成模糊集合的隶属函数。方法中使用隶属函数为模式分类的判别函数。这些隶属函数既简单又易于计算, 故适宜实时执行。实验结果表明, 总的识别率高于99%。  相似文献   

7.
汉语是一种带声调的语言,声调信息在汉语语音识别中具有非常重要的意义。提出了emt}eaaea声调模型与explicit声调模型相结合的方法用以识别汉语连续语音的声调。该方法能够将逐帧的基频信息和较强时长的基频信息相结合来识别声调。在“863-Test”和“TestCorpus98"测试集上的实验表明,该方法分别能够达到96. 12%和93.78 %的声调识别正确率。  相似文献   

8.
计算机能听懂人的语言,这意味着人工智能时代已向我们走来c北京中自汉王科技公司在IBM支持下,基于ViaVoice自行开发的一种最新语音识别软件与手写输入系统——汉王听写系统,它把IBM研究开发的语音识别核心技术与汉三优秀的手写汉字识别输入系统完美的集成在一起.形成了一个优势互补的非键盘输入系统。成为一种简单方便,人人会用的文字录入工具。这不仅提高了汉字输入速度,而且使讲话人更自然、更流畅地表达自己的意愿。汉王听写系统,具有汉语语音听写输入、语音命令、编辑、打印功能,基于中文自身的特点,同音字多,有声调、词…  相似文献   

9.
林志伟  徐东昕 《计算机学报》1991,14(12):946-949
1.引言 人工神经网络模型是由大量的简单计算单元广泛相互连接而成的具有高度并行处理能力的复杂系统,它是一种非线性系统,具有高度的自组织能力,它的整体性能并不是各个单元的简单迭加,而表现为整个网络的复杂的有组织的集体行为;它的大规模的并行处理和广泛的连接使得其储存的知识和信息分布在网络中各神经元的连接强度中,提供了很高程度的鲁棒性和容错能力;它还能够不断地调整网络中各神经元的连接强度以改  相似文献   

10.
汉语声调识别中的基音平滑新方法   总被引:13,自引:0,他引:13  
汉语普通话是一种带声调的语言。声调可以用基音的轮廓信息进行描述。传统基音的平滑方法:线性平滑、中值平滑和一般的线性插值方法都不能很好地处理连续的基音频率有随机错误点的情况。本文提出了一种通过搜索来得到更精确的基音轮廓的新的基音平滑方法。这种方法具有简单可靠,快速高效的特点。实验表明这种方法比传统的方法识别错误率降低约40%。  相似文献   

11.
汉语连续语流中的调型评测是汉语语音评测的一个重要环节,利用连续语流中韵律耦合效应和韵律结构紧密相关这一特性,以韵律词为基本建模单元,建立基于多空间概率分布的HMM调型模型(MSD-HMM),使得汉语普通话水平评测系统针对标准连续语流的调型识别率从82.0% 提升至84.6%;针对有方言背景的非标准发音,机器评分与专家评分的相关度绝对提升超过3.0%。  相似文献   

12.
简要地介绍了用于语音分析合成的时城基音同步叠加算法,在此基础上提出一种汉语语音时域声调转换方法。利用这种方法可以将一种声调的语音转换为另一种声调的语音,除微小的音质降低外,仍可保持较好的语音质量。这种方法直接对语音波形进行处理,具有计算简单、能在一般微型计算机上进行实时的特点。将之用于语音合成系统,可以通过相同声韵母的音节只存储一种声调的语音数据而大大降低音库的容量;用这种方法按照汉语语句的语调变化规律来合成语句,还可以较好地改善汉语语句合成的自然度.  相似文献   

13.
基于两级BP模型的普通话声调识别系统   总被引:1,自引:2,他引:1  
普通话声调识别参数除常用的基音轮廓外,基音的一阶差分、能量及能量的一阶差分等也具一定的声调特征。实验结果表明:如果将各种参数同时作为一个BP模型的输入参数,声调识别率不但没有提高,反而显著下降,因此,该文提出了将各种参数分别训练一个各自的BP网络,再将这些网络的输出作为另一高层BP网络的输入的普通话声调识别方法。另外,针对上声的特点提出了一种改进的基音平滑算法。这些方法的运用使系统的声调识别率达到90.05%。  相似文献   

14.
数据挖掘在音高变化规律学习中的应用   总被引:1,自引:0,他引:1  
音高变化规律对合成高自然度的语音非常重要.为了提取音高即基频的变化规律,设计实现了数据挖掘系统SpeechDM,经过训练取得了较好的学习结果.该文介绍了国内进行的关于音高变化规则的研究情况以及数据挖掘技术,给出SpeechDM的系统结构,并介绍其主要模块,对实验结果进行了分析.  相似文献   

15.
文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法:在音频和视频集成建模方面,使用多数据流HMM来反映语音的双模型特性。识别实验表明,文中建立的音频视频连续语音识别系统具有很好的抗噪性。  相似文献   

16.
HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成以及字符识别等领域。文章在详细介绍了语音识别的过程、原理及相关概念的基础之上,介绍了HTK的基本原理和软件结构,以及使用HTK完成语音识别任务的整个过程。最后,讨论声学单元等一系列的模型参数的选择,使用HTK搭建一个简单连续汉语语音输入系统。  相似文献   

17.
具有确定词表的词组语音识别是语音识别研究的一个重要方面,应用相当广泛。本文在简单介绍词组语音识别之后给出了一个基于连续语音识别算法和词树约束的汉语词组语音识别方法。这种方法通过在束搜索连续语音识别算法中引入词树约束信息,发挥了连续语音识别算法的优点,并且充分利用了确定词表的约束信息,提高了计算和搜索的效率。然后介绍了约束词树和它的高效存储结构,这种结构提高了约束词树的存储效率和在识别搜索中的检索效率;最后给出实验的结果和讨论并进行简要的总结。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号