首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
汉语连续语音中声调识别的特殊性研究   总被引:1,自引:0,他引:1  
大词汇连续语识别是当前语音识别研究的主流,探讨其中声调识别的特殊是一项有意义的工作,本文从声调获取,语音分割,声调模式和声调识别等进行了研究,通过对现有研究成果的分析和总结,并结合自己的研究工作,得出了若干结论,提出了基于音节的连续语音声调识别思想。  相似文献   

2.
首先,给出结合韵律信息的系统框架。然后,针对汉语的特点,解决了韵律相关的语音识别系统中建模单元选择、模型训练等问题,并在多空间概率分布隐马尔可夫模型(multiple-space distribution hidden Markov model, MSD-HMM)框架下构建了韵律相关的语音识别系统。最后,通过语音识别的实验验证了方法的有效性。在“863”测试集上,该方法能够达到76.18%的带调音节识别正确率。  相似文献   

3.
基于统计方法的汉语连续语音中声调模式的研究   总被引:4,自引:0,他引:4  
曹阳  黄泰翼  徐波 《自动化学报》2004,30(2):191-198
提出采用决策树的数据驱动方法,结合专家知识.从大规模语料中统计学习出连续语音中声调模式的分布.在建立决策树的过程中,除了相邻音节的声调外.还考虑了多种可能影响声调模式的因素,如音节声韵母发音特点的分类、音节在词中的位置等.决策树建立后,共得到28种声调模式.通过对结果的分析发现,除了上下文的声调外,其它因素对连续语音中声调模式的变化也有一定的影响.声调识别实验的结果证明了该方法的有效性.  相似文献   

4.
用于汉语单音节声调识别的基频轨迹拟合方法   总被引:1,自引:0,他引:1  
基于Target模型的思想,对汉语声调基频轨迹进行研究,总结了四种声调曲线参数的变化规律,提出了对基频轨迹进行分段曲线拟合的方法。使用该方法提取出的反映基频变化趋势的特征向量,在不受基频曲线两端不准确点影响的同时起到了长度归一化的作用。使用该向量进行声调识别,取得了95.17%的满意识别结果。  相似文献   

5.
在汉语语音识别中应用声调信息的研究   总被引:6,自引:0,他引:6  
声调信息在汉语普通话语音识别系统中,具有非常重要的意义。文章实现了声调特征提取的算法,并主要研究了如何应用这些特征,才能最大限度地发挥声调信息的作用,提高识别系统的性能。实验结果表明,声调特征可以和识别系统原有的特征很好地结合,合理应用声调信息能有效地提高识别系统的性能,系统的误识率下降了22.26%。  相似文献   

6.
支持向量机的汉语连续语音声调识别方法   总被引:1,自引:1,他引:1  
声调信息在汉语语音识别中具有非常重要的意义。采用支持向量机对连续汉语连续语音进行声调识别实验,首先采用基于Teager能量算子和过零率的两级判别策略对连续语音进行浊音段提取,然后建立了适合于支持向量机分类模型的等维声调特征向量。使用6个二类SVM模型对非特定人汉语普通话的4种声调进行分类识别,与BP神经网络相比,支持向量机具有更高的识别率。  相似文献   

7.
汉语语音识别中的区分性声调建模方法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出从特征提取参数、模型参数对隐马尔可夫声调模型进行区分型训练,来提高声调识别率;提出模型相关的权重对谱特征模型和声调模型的概率进行加权,并根据最小音子错误区分性目标函数对权重进行训练,来提高声调模型加入连续语音识别时的性能。声调识别实验表明区分性的声调模型训练以及特征提取方法显著提高了声调识别率。区分性模型权重训练能够在声调模型加入之后进一步连续语音识别系统的识别率。  相似文献   

8.
晁浩  杨占磊  刘文举 《计算机应用》2013,33(10):2939-2944
发音特征表征了语音的发音方式信息,能够辅助传统的韵律特征改善声调建模的精度。在分析汉语声韵母发音特点的基础上,将发音方式划分为19类,并提出利用阶层式多层感知器计算语音信号属于各类的后验概率,作为发音特征。之后,将发音特征与传统的韵律特征一起用于声调建模。实验结果显示,加入发音特征后,在三种不同的建模方法下声调识别的准确率提升约5%。将声调模型融入大词表连续语音识别系统后,汉字错误率有了明显的下降  相似文献   

9.
林志伟  徐东昕 《计算机学报》1991,14(12):946-949
1.引言 人工神经网络模型是由大量的简单计算单元广泛相互连接而成的具有高度并行处理能力的复杂系统,它是一种非线性系统,具有高度的自组织能力,它的整体性能并不是各个单元的简单迭加,而表现为整个网络的复杂的有组织的集体行为;它的大规模的并行处理和广泛的连接使得其储存的知识和信息分布在网络中各神经元的连接强度中,提供了很高程度的鲁棒性和容错能力;它还能够不断地调整网络中各神经元的连接强度以改  相似文献   

10.
利用语音信号与噪声信号具有不同相关特性的特点,提出了一种新的加权自相关基频检测算法,该方法可以提高噪声环境下基音检测的准确性。在分类器设计方面,通过引入支持矢量机,进一步提高低信噪比下的汉语声调识别率。实验结果表明,新方法对提高噪声环境下的声调识别效果是十分有效的。  相似文献   

11.
Tone study is very important for Mandarin speech recognition. In this paper, a Mixture Stochastic Polynomial Tone Model (MSPTM) is proposed for tone modeling in continuous Mandarin speech. In this model the pitch contour, main representative of tone pattern, is described as a mixed stochastic trajectory. The mean trajectory is represented by a polynomial function of normalized time while the variance is time varying. Effective training and tone recognition algorithms were developed. The experimental results based on the proposed MSPTM showed 40.7% tone recognition error rate reduction relative to the traditional Hidden Markov Model (HMM) tone model. We also present a decision tree based approach to learning the tone pattern variation in continuous speech. The phonetic and linguistic factors that may affect the tone patterns were taken into consideration while constructing the tree. After the tree was established, 28 different tone patterns were obtained. We found that in addition to the tone of the neighboring syllable, Consonant/Vowel type of the syllable and the position of the syllable in the utterance also made important contributions to tone pattern variations in continuous speech. Finally, a new approach of integrating tone information into the search process at word level is discussed. Experiments on continuous Mandarin speech recognition showed that the new tone model and tone information integration method were efficient, achieving a 16.2% relative character error rate reduction.  相似文献   

12.
提出了一种新的基于高斯概率模型的字符识别算法,该算法根据模式识别的样本分布特征与高斯分布的一致性,构建了一个高斯概率模型.在模型中存储概率为P的训练样本,分类识别时,将测试样本与模型进行相关计算得出概率值,进行判断.结果表明,该算法识别速度快,准确率高,与其他字符识别算法(KNN)相比有更好的实用性.  相似文献   

13.
汉语大词汇量连续语音识别系统研究进展   总被引:5,自引:1,他引:5  
大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的研究进展,描述了汉语大词汇量连续语音识别系统,主要是基于统计方法的语音识别系统的框架与设计方法,对语音识别系统的一些关键技术和原理进行了分析,并对近年来国内外对语音识别研究发展动向进行了讨论。  相似文献   

14.
高分辨率SAR图像目标识别系统首先要检测出图像中可能的目标区域。该文利用累积概率分布及K-S距离方法确定海洋SAR图像中可能的目标区域,并提出了综合分析整幅图像及目标区域图像确定阈值的方法,利用此方法把成群像素区域二值化为二值图像,二值化结果优于常规方法,特别适用于弱对比度的SAR图像目标检测识别。  相似文献   

15.
基于后验概率解码段模型的汉语语音数字串识别   总被引:4,自引:0,他引:4  
唐赟  刘文举  徐波 《计算机学报》2006,29(4):635-641
通过对语音解码的分析指出了基于似然概率解码的连续语音识别的局限性,并给出了三种基于后验概率段模型(Segment Model,SM)的语音解码方法.这三种方法成功地运用于随机段模型(Stochastic Segment Model,SSM),使误识率比基线系统下降了11%;与此同时还给出了段模型的快速算法,使算法的计算复杂度降到了与隐马尔可夫模型(Hidden Markov Model,HMM)相同的数量级,满足了实用要求.  相似文献   

16.
基于两级BP模型的普通话声调识别系统   总被引:1,自引:2,他引:1  
普通话声调识别参数除常用的基音轮廓外,基音的一阶差分、能量及能量的一阶差分等也具一定的声调特征。实验结果表明:如果将各种参数同时作为一个BP模型的输入参数,声调识别率不但没有提高,反而显著下降,因此,该文提出了将各种参数分别训练一个各自的BP网络,再将这些网络的输出作为另一高层BP网络的输入的普通话声调识别方法。另外,针对上声的特点提出了一种改进的基音平滑算法。这些方法的运用使系统的声调识别率达到90.05%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号