排序方式: 共有90条查询结果,搜索用时 31 毫秒
81.
82.
83.
84.
1 引言在汉语文-语转换系统(CTTS)的研究中,要求系统合成的语音应尽量模拟自然语音,体现出语言抑扬顿挫的美感。这需要正确地界定韵律短语,细微地模拟自然语音的韵律模式。自然语音在字调、语调、重音等方面的变化,其声学特征的表现为音长、基频和幅度等时域参数。因此,在基于时域PSOLA的CTTS研究 相似文献
85.
Grading the Severity of Mispronunciations in CAPT Based on Statistical Analysis and Computational Speech Perception
下载免费PDF全文
![点击此处可从《计算机科学技术学报》网站下载免费的PDF全文](/ch/ext_images/free.gif)
Computer-aided pronunciation training(CAPT) technologies enable the use of automatic speech recognition to detect mispronunciations in second language(L2) learners' speech. In order to further facilitate learning, we aim to develop a principle-based method for generating a gradation of the severity of mispronunciations. This paper presents an approach towards gradation that is motivated by auditory perception. We have developed a computational method for generating a perceptual distance(PD) between two spoken phonemes. This is used to compute the auditory confusion of native language(L1). PD is found to correlate well with the mispronunciations detected in CAPT system for Chinese learners of English,i.e., L1 being Chinese(Mandarin and Cantonese) and L2 being US English. The results show that auditory confusion is indicative of pronunciation confusions in L2 learning. PD can also be used to help us grade the severity of errors(i.e.,mispronunciations that confuse more distant phonemes are more severe) and accordingly prioritize the order of corrective feedback generated for the learners. 相似文献
86.
波形编辑语音合成技术及在汉语TTS中的应用 总被引:3,自引:0,他引:3
蔡莲红 《小型微型计算机系统》1994,15(10):11-16
本文介绍了近几年迅速发展的基于波形编辑的语音合成技术。文中简介了它的研究内容、基本算法,还介绍了用波形编辑方法实现的汉语文-语转换系统。 相似文献
87.
88.
分类问题是数据挖掘中的一个重要问题,分类目的就是寻找规则,具体来说,就是从给定的数据集合中找出能把数据集划分成不相交的若干个组的规则,目前已有的在大型数据库中挖掘分类规则的数据挖掘方法,主要还是基于符号学习机制的决策树方法.本文研究了一种新型的规则抽取算法,能够从神经网络中抽取出较好的规则. 相似文献
89.
在文语转换系统中,从文本中预测出准确的韵律结构对于提高合成语音的自然度具有重要的作用。利用10 000句标注了词性标记的文本语料,在语言学专家的指导下,人工标注了语料的韵律词和韵律短语。选择了标注结果一致性最高的500句语句,标注了语法层级结构,并利用语法树高度描述语法词之间连接的紧密程度。通过分析韵律短语边界与语法结构的关系,发现韵律短语边界受语法树高度、语法词词性和语法词词长的影响,因此选择了这三个特征,利用TBL算法和400句训练语句训练了预测模型。测试集上的预测结果表明,提出的方法在小规模训练语料下,韵律短语预测的精确率达到了75.2%,召回率达到了77.1%,F-Score达到了76.1%。 相似文献
90.
视觉语音参数估计在视觉语音的研究中占有重要的地位.从MPEG-4定义的人脸动画参数FAP中选择24个与发音有直接关系的参数来描述视觉语音,将统计学习方法和基于规则的方法结合起来,利用人脸颜色概率分布信息和先验形状及边缘知识跟踪嘴唇轮廓线和人脸特征点,取得了较为精确的跟踪效果.在滤除参考点跟踪中的高频噪声后,利用人脸上最为突出的4个参考点估计出主要的人脸运动姿态,从而消除了全局运动的影响,最后根据这些人脸特征点的运动计算出准确的视觉语音参数,并得到了实际应用. 相似文献