首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
对于英语等“重音节拍语言”,重音是一个非常重要的韵律学特征。从听觉模型的角度出发,利用基音同步幅度峰值特征能同时表征瞬时频率和强度信息的特点进行重音检测。使用基音同步幅度峰值特征以及与传统特征的组合对英语连续语音的试验结果表明,新特征能使系统误识率降低1.5%。  相似文献   

2.
对于英语等"重音节拍语言",重音是一个非常重要的韵律学特征。针对传统特征提取中固定帧长方式存在的缺点,使用基音同步帧特征分析方法,提出了基于动态帧长的基音同步能量和基音同步峰值特征。在使用新特征对英语连续语音进行词重音检测时发现,联合使用新特征与传统特征,可使误识率下降6.65%。  相似文献   

3.
汉语重音及在TTS系统中的模拟   总被引:1,自引:0,他引:1  
改善TTS输出语音的自然度,增强其表现力,是我们的研究目标。为此,本文设计实现了10个韵律参数控制符,以汉语语音学为依据,以听测为检验手段,研究了词组和句子重音的韵律模型,相应地制了韵律的悠规则,使输出语音更有自然语流感,可表现一定的重音。  相似文献   

4.
维吾尔语音节语音识别与识别基元的研究   总被引:1,自引:0,他引:1  
王昆仑 《计算机科学》2003,30(7):182-184
1 引言现代维吾尔语(以下简称维语)是维吾尔族人民的主要交际工具,是我国新疆维吾尔自治区的法定工作用语之一,也是新疆其它少数民族共同的交际用语之一。维语属阿尔泰语系,突厥语族。维语语音有元音8个、辅音24个。由辅音和元音构成维语语音音节,每个音节必须且只能有一个元音,单元音可构成音节。维语句子由词构成。句子中有意群重音和句重音。部分音节在语流中产生语流音变现象,常见的有同化、弱化、脱落以及元音和谐等现象。  相似文献   

5.
针对目前高职院校学生英语学习中语音语调难提高等问题,做了一系列试验研究,通过语音处理软件Pratt,测试学生能否利用基于这种软件的学习方法来纠正错误的英语发音和准确找出英语语句重音,本文通过阐述此次试验研究的过程和得出的结果,表明这种方法可以达着较好的效果。  相似文献   

6.
焦点是语言学界广泛关注的问题。随着实验语音学与心理语言学的发展,国内外对焦点的韵律表达及认知加工方面的研究发展迅速,主要涉及焦点的语音与音系表征、焦点与重音的对应关系,以及句子理解中焦点加工与韵律加工的大脑机制等问题。该文从这一角度对相关研究进行回顾与总结,介绍该领域的发展状况及主要研究方向并提出见解和评论,以期对今后的研究有所启发。  相似文献   

7.
基频是发浊音时声带振动频率,通常用F0表示。在一个音节或连续的语音段中,F0是随时间变化的,这种变化的轨迹形成了基频曲线。基频曲线的走势可以反映出语句的重音、语调等韵律信息,所以对基频曲线的描述和研究就显得尤为重要。该文首先提出了一种基频曲线描述方法,即导数域编码方法,同时探讨了该编码方法在语音发音质量评价中对韵律的作用。实验结果表明基于该描述方法能够提高英语发音语调质量评价的性能,主观和客观评价的相关性由原来的基于基音极值差的0.38提高到0.49。  相似文献   

8.
语音作为一个交叉学科,具有深远的研究和应用价值。语音句子边界检测是语音识别中的一个重要步骤,它可以使语音识别具有更好的可读性,并能使我们理解语言处理模块。本文介绍了语音句子边界检测中常用的模型及评价标准。  相似文献   

9.
支持重音合成的汉语语音合成系统   总被引:1,自引:1,他引:1  
针对基于单元挑选的汉语语音合成系统中重音预测及实现,本文采用了知识指导下的数据驱动建模策略。首先,采用经过感知结果优化的重音检测器,实现了语音数据库的自动标注;其次,利用重音标注数据库,训练得到支持重音预测的韵律预测模型;用重音韵律预测模型替代原语音合成系统中的相应模型,从而构成了支持重音合成的语音合成系统。实验结果分析表明,基于感知结果优化的重音检测器的标注结果是可靠的;支持重音的韵律声学预测模型是合理的;新的合成系统能够合成出带有轻重变化的语音。  相似文献   

10.
语音作为一个交叉学科,具有深远的研究和应用价值.语音句子边界检测是语音识别中的一个重要步骤,它可以使语音识别具有更好的可读性.并能使我们理解语言处理模块.本文介绍了语音句子边界检测中常用的模型及评价标准.  相似文献   

11.
当今高校的大学生英语口语存在的问题呈现出比较显著的特征。针对这些问题,本研究尝试利用智能手机辅助大学生提高英语口语。经过实验,我们发现,基于智能手机终端的大学生英语口语学习是十分可行的,学生们在英语发音、语音语调、轻重音等方面,都得到了很大的改善。  相似文献   

12.
通过严格控制的语音实验,系统研究了维吾尔语焦点和疑问语气对语调的调节作用。结果发现维吾尔语疑问句中焦点对音高和时长都有调节作用:1)焦点词音高上升、音域扩大,焦点后音高仍保持高,但焦点前的音高基本不变; 2)疑问语调的重要特征是句末音高出现大幅度上扬,另外疑问句中焦点词后的音高高于其在陈述句条件下的表现; 3)焦点成分时长延长,而焦点前后成分的时长变化不明显; 4)与陈述句相比,疑问句的总时长要长于陈述句的,且主要表现在句末成分的时长上。总之,维吾尔语和汉语、英语一样支持平行编码目标逼近(PENTA)语调模型,但是三种语言在疑问句中焦点后的语调变化方式上并不相同。  相似文献   

13.
李婧  黄双  张波 《计算机工程》2008,34(22):207-209
将已经成功应用到说话人识别/确认领域中的高斯混合模型和全局背景模型(UBM)引入语音发音质量评价领域,提出一种新的评价英语发音质量的算法。该算法训练出标准发音的全局背景模型。UBM模型描述与音素无关的特征分布,定义段时长归一化的相似度比例对数为音素的发音质量分数,综合得到整句发音的评分结果。实验证明,在实验室自行采集的非母语语音数据库上,该算法评分与专家评分的相关性达到了0.700,优于其他评分算法。  相似文献   

14.
This paper describes an approach for automatic scoring of pronunciation quality for non-native speech. It is applicable regardless of the foreign language student’s mother tongue. Sentences and words are considered as scoring units. Additionally, mispronunciation and phoneme confusion statistics for the target language phoneme set are derived from human annotations and word level scoring results using a Markov chain model of mispronunciation detection. The proposed methods can be employed for building a part of the scoring module of a system for computer assisted pronunciation training (CAPT). Methods from pattern and speech recognition are applied to develop appropriate feature sets for sentence and word level scoring. Besides features well-known from and approved in previous research, e.g. phoneme accuracy, posterior score, duration score and recognition accuracy, new features such as high-level phoneme confidence measures are identified. The proposed method is evaluated with native English speech, non-native English speech from German, French, Japanese, Indonesian and Chinese adults and non-native speech from German school children. The speech data are annotated with tags for mispronounced words and sentence level ratings by native English teachers. Experimental results show, that the reliability of automatic sentence level scoring by the system is almost as high as the average human evaluator. Furthermore, a good performance for detecting mispronounced words is achieved. In a validation experiment, it could also be verified, that the system gives the highest pronunciation quality scores to 90% of native speakers’ utterances. Automatic error diagnosis based on a automatically derived phoneme mispronunciation statistic showed reasonable results for five non-native speaker groups. The statistics can be exploited in order to provide the non-native feedback on mispronounced phonemes.  相似文献   

15.
发音问题是初学英语的一大难题。在我国这样的非英语环境中,很多小学生课后缺少专业老师辅导,极易出现英语发音障碍。本文设计开发了一个基于可视语音的英语发音辅导系统EP Tutor,模拟一个卡通家教的脸部动画,生动亲切的为学生一对一辅导英语发音。本文重点讨论了系统设计理念、系统架构、部分关键功能的详细设计以及关键技术的实现。  相似文献   

16.
赵芳丽 《计算机工程与应用》2012,48(11):133-136,177
用语音合成与分析软件praat分析了中国学生俄语读音的一些特点。通过对语音信号的波形图、语图谱、基音、共振峰、音高、音强等声学特性的分析,研究了中国学生在音素、音节、重音、音调、节奏、语调等方面存在的差异,为纠正其不良的发音、读句习惯提供技术帮助。  相似文献   

17.
英语语调对语义表达和人际交流至关重要,论文以“十二五”规划中原经济区建设英语人才培养为背景,以全国教育科学“十二五”规划教育部重点课题“中原地区英语学习者英语语调特征研究”为依托,针对语调的基本特点,设计并实现了针对中原地区英语语调的统计分析系统,并对其关键技术进行分析。系统利用正则表达式对输入的标注语句进行自动统计及分析,同时本系统提供修正功能,实验表明该系统能为项目的高效顺利实施提供必备的技术保障。  相似文献   

18.
目前,国内外对人脸口型动画的研究主要是基于英文开展,而中文人脸口 型动画合成方面的研究还很少。论文结合已有的研究,综合汉语拼音发音时口型变化的规律 和汉语标号的时间控制,提出了声韵加权控制算法,并对整句、整段话中的标号加以权重向 量的分析,能够合成与语音同步的连续变化的三维口型动画模型。在两个连续口型动画过渡 处理上,通过一种余弦函数的插值方法,合成得到两个连续口型之间的过渡口型序列,从而 使合成的汉语语音同步的人脸口型动画更加平滑流畅。  相似文献   

19.
曾定  刘加 《计算机工程》2010,36(8):170-172
为了兼容母语与非母语说话人之间的发音变化,提出一种新的声学模型建模方法。分析中国人受母语影响产生的英语发音变化,利用中国人英语发音数据库自适应得到语音模型,采用声学模型融合技术构建融合2种发音规律的识别模型。实验结果证明,中国人英语发音的语音识别率提高了13.4%,但标准英语的语音识别率仅下降1.1%。  相似文献   

20.
主要研究如何更好地让计算机智能地纠正英语学习者的发音错误。借助语音识别中的HMM(隐马尔可夫模型)建模方法,用Viterbi算法和改进的后验概率算法对中国学习者的英语发音进行自动识别,通过对基本单元进行切分和评分,最后,为英语学习者提供可信度比较高的发音信息反馈,纠正发音错误。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号