共查询到16条相似文献,搜索用时 78 毫秒
1.
汉语连续语音中声调识别的特殊性研究 总被引:1,自引:0,他引:1
大词汇连续语识别是当前语音识别研究的主流,探讨其中声调识别的特殊是一项有意义的工作,本文从声调获取,语音分割,声调模式和声调识别等进行了研究,通过对现有研究成果的分析和总结,并结合自己的研究工作,得出了若干结论,提出了基于音节的连续语音声调识别思想。 相似文献
2.
3.
4.
用于汉语单音节声调识别的基频轨迹拟合方法 总被引:1,自引:0,他引:1
基于Target模型的思想,对汉语声调基频轨迹进行研究,总结了四种声调曲线参数的变化规律,提出了对基频轨迹进行分段曲线拟合的方法。使用该方法提取出的反映基频变化趋势的特征向量,在不受基频曲线两端不准确点影响的同时起到了长度归一化的作用。使用该向量进行声调识别,取得了95.17%的满意识别结果。 相似文献
5.
在汉语语音识别中应用声调信息的研究 总被引:6,自引:0,他引:6
声调信息在汉语普通话语音识别系统中,具有非常重要的意义。文章实现了声调特征提取的算法,并主要研究了如何应用这些特征,才能最大限度地发挥声调信息的作用,提高识别系统的性能。实验结果表明,声调特征可以和识别系统原有的特征很好地结合,合理应用声调信息能有效地提高识别系统的性能,系统的误识率下降了22.26%。 相似文献
6.
7.
提出从特征提取参数、模型参数对隐马尔可夫声调模型进行区分型训练,来提高声调识别率;提出模型相关的权重对谱特征模型和声调模型的概率进行加权,并根据最小音子错误区分性目标函数对权重进行训练,来提高声调模型加入连续语音识别时的性能。声调识别实验表明区分性的声调模型训练以及特征提取方法显著提高了声调识别率。区分性模型权重训练能够在声调模型加入之后进一步连续语音识别系统的识别率。 相似文献
8.
9.
1.引言 人工神经网络模型是由大量的简单计算单元广泛相互连接而成的具有高度并行处理能力的复杂系统,它是一种非线性系统,具有高度的自组织能力,它的整体性能并不是各个单元的简单迭加,而表现为整个网络的复杂的有组织的集体行为;它的大规模的并行处理和广泛的连接使得其储存的知识和信息分布在网络中各神经元的连接强度中,提供了很高程度的鲁棒性和容错能力;它还能够不断地调整网络中各神经元的连接强度以改 相似文献
10.
利用语音信号与噪声信号具有不同相关特性的特点,提出了一种新的加权自相关基频检测算法,该方法可以提高噪声环境下基音检测的准确性。在分类器设计方面,通过引入支持矢量机,进一步提高低信噪比下的汉语声调识别率。实验结果表明,新方法对提高噪声环境下的声调识别效果是十分有效的。 相似文献
11.
Yang Cao Shuwu Zhang Taiyi Huang Bo Xu 《International Journal of Speech Technology》2004,7(2-3):115-128
Tone study is very important for Mandarin speech recognition. In this paper, a Mixture Stochastic Polynomial Tone Model (MSPTM) is proposed for tone modeling in continuous Mandarin speech. In this model the pitch contour, main representative of tone pattern, is described as a mixed stochastic trajectory. The mean trajectory is represented by a polynomial function of normalized time while the variance is time varying. Effective training and tone recognition algorithms were developed. The experimental results based on the proposed MSPTM showed 40.7% tone recognition error rate reduction relative to the traditional Hidden Markov Model (HMM) tone model. We also present a decision tree based approach to learning the tone pattern variation in continuous speech. The phonetic and linguistic factors that may affect the tone patterns were taken into consideration while constructing the tree. After the tree was established, 28 different tone patterns were obtained. We found that in addition to the tone of the neighboring syllable, Consonant/Vowel type of the syllable and the position of the syllable in the utterance also made important contributions to tone pattern variations in continuous speech. Finally, a new approach of integrating tone information into the search process at word level is discussed. Experiments on continuous Mandarin speech recognition showed that the new tone model and tone information integration method were efficient, achieving a 16.2% relative character error rate reduction. 相似文献
12.
13.
14.
15.
16.
基于两级BP模型的普通话声调识别系统 总被引:1,自引:2,他引:1
普通话声调识别参数除常用的基音轮廓外,基音的一阶差分、能量及能量的一阶差分等也具一定的声调特征。实验结果表明:如果将各种参数同时作为一个BP模型的输入参数,声调识别率不但没有提高,反而显著下降,因此,该文提出了将各种参数分别训练一个各自的BP网络,再将这些网络的输出作为另一高层BP网络的输入的普通话声调识别方法。另外,针对上声的特点提出了一种改进的基音平滑算法。这些方法的运用使系统的声调识别率达到90.05%。 相似文献