首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
基频轮廓就是基频随时间变化的曲线,刻画了汉语中最主要的韵律特征-声调和语调的变化趋势。而藤崎模型则是日本东京大学藤崎博也教授建立的一种韵律模型,可以用来非常好地逼近汉语语音的基频轮廓。本文提出了一种基于该模型的从汉语单音节的基频轮廓中提取参数的方法,我们首先采用基于小波变换的基音检测技术(3)获取非常准确的给定单字的各基频值,并连接形成基频轮廓,然后根据最小均匀误差准则,用藤崎模型来拟合各基频点,  相似文献   

2.
合成语音自然度客观测度   总被引:2,自引:1,他引:1  
目前合成语音的自然度有待提高,论文根据目前的研究现状提出了一种合成语音自然度的客观评价方法,该方法主要从语音韵律特征的主要参数出发,计算同一发音人的自然语音和合成语音之间的基频、时长、音强等参数的差距,其中由于两种语音基频时间不匹配,所以采用DTW(Dynamic Time Warping)算法来对两种语音的基频进行了时间弯折对准。最后再将计算结果与主观评测(MOS)的结果进行比较。实验数据表明,论文提出的基频曲线失真测度与MOS之间具有很强的相关性,从韵律特征角度给出的评价结果能够衡量合成语音的自然度。  相似文献   

3.
该文报告了组合LPC参数以及基频F0的高斯混合模型(GMM)电话语音说话人自动识别技术的实验研究结果。该研究在基线试验中GMM使用16混合共分散对角矩阵,特征量为LPC倒谱系数。而在开发系统测试中分别利用语音的全发话区间和有声区间两部分参数增加基频参数进行试验,并给出实验比较结果。在50人电话通话开放集自动切分语音流实验中正确识别率为76.97%,而提案方法为80.29%,改善率为3.32%。接近人工切分语音流时的识别率82.34%。  相似文献   

4.
韵律规则对于语音识别和语音合成具有重要意义,韵律特征参数的描述正确与否直接影响合成系统的输出.为了提高藏语语音合成中语音的自然度,本文研究了基于数据挖掘中的关联规则来发现韵律参数之间的相互关系,并基于关联规则算法获得藏语韵律参数中基频参数的变化规则,这些规则可以为藏语语音合成系统的选音提供帮助.  相似文献   

5.
该文主要基于共振峰对六对发音相似的朝汉语单元音的分类方法进行了研究。首先,提取音频文件的前三个共振峰F1、F2、F3;其次,分析六对发音相似的朝汉语单元音的共振峰分布差异,针对不同的分类对象选择不同的共振峰频率特征参数或其组合形式作为分类特征;最后,采用信息增益方法确定分类阈值并对朝汉语单元音进行分类。实验结果表明,朝鲜语单元音和具有相似发音的汉语单元音之间存在可区分性,所采用的方法计算过程简单,获得了良好的分类效果。  相似文献   

6.
在语音合成技术的研究中,情感语音合成是当前研究的热点.在众多研究因素中,建立恰当的韵律模型和选取好的韵律参数是研究的关键,它们描述的正确与否,直接影响到情感语音合成的输出效果.为了攻克提高情感语音自然度这一难点,对影响情感语音合成技术韵律参数进行了分析,建立了基于关联规则的情感语音韵律基频模型.本文通过研究关联规则、改进数据挖掘Apriori算法并由此来获得韵律参数中基频变化规则,并为情感语音合成的选音提供指导和帮助.  相似文献   

7.
1 引言在汉语文-语转换系统(CTTS)的研究中,要求系统合成的语音应尽量模拟自然语音,体现出语言抑扬顿挫的美感。这需要正确地界定韵律短语,细微地模拟自然语音的韵律模式。自然语音在字调、语调、重音等方面的变化,其声学特征的表现为音长、基频和幅度等时域参数。因此,在基于时域PSOLA的CTTS研究  相似文献   

8.
提出一种使用韵律模型的方法来改进计算机辅助语言学习中的发音质量评价性能.该方法在原有的单音子和三音子模型的基础上,添加了韵律因素.一方面,这使得对影响发音质量最大的元音音素的描述更为细致;另一方面,包含韵律模型的方法从一定程度上解决了使用母语训练库和非母语测试库之间的模型不匹配问题,为语言学习机在母语和非母语之间的交叉应用提供了可能.同时,这种改进的方法还为计算机辅助语言学习系统中的错误检测和反馈提供了很好的参考,更进一步增加了发音质量评价模块在整个学习机系统中的指导作用.试验中,使用WSJ(母语库)作为训练库,ESC(非母语库)作为测试库,基于带韵律的Mono-Phone模型得到的匹配分数,段长分数,感知分数融合结果与主观评价之间的最终相关性为0 839,比原有基本英语音素的方法的融合结果提高了0 08(0 753).  相似文献   

9.
本文对富士通中文语音合成系统尤其是其中的韵律生成部分进行了描述。该系统是一个以音节为基本合成单元,在韵律参数生成结果即音长和基频预测结果的指导下,从音库中搜寻全局最优的合成单元,然后采用PSOLA算法进行波形调整的拼接合成系统。从提高合成语音韵律的角度出发,本文围绕音长预测和基频预测部分对该系统进行了详细的描述。最后,给出了韵律评测和系统评测的结果。  相似文献   

10.
该文介绍了如何利用三音子模型和基频信息来提高汉语连续数字串的识别性能。三音子模型考虑了前后语音协同发音的影响,将上下文考虑到模型中去,可以更好地描述连续语音;各个音节的基频是随时间而变化的,其不同轨迹构成了声调,利用基频信息进一步提高了对汉语连续数字串的识别率。  相似文献   

11.
基频是基于模型的语音合成系统中重要的一个因素,该文主要利用韵律信息仿真普通话基频曲线特征值,并分析音节基频各个特征值在韵律环境下的稳定性。该文将前一音节的终止基频值与韵律参数结合,通过数据挖掘技术寻找影响各个特征值的重要韵律参数,并用这个结果建立韵律模型,然后仿真基频曲线特征值,并得到了一个良好的结果。通过分析发现在连续语流中,体现频率特性的特征值中,基频均值和最小值的稳定性较强;体现时间特性的特征值中,音节时长的稳定性较强。  相似文献   

12.
本文提出一种新型的音乐信息检索索引方法,并将其应用于哼唱检索系统上,获得可喜的成果。该方法根据音乐旋律的特点,使用音高和音长描述一段乐曲。考虑到各种音乐输入方式存在的音高不一致性和节奏伸缩性,系统根据乐曲旋律特征的总体变化,将平均音高差和平均音长变化百分比作为关键字建立M树索引结构。由于各类输入旋律常常存在误差,本文定义一定的搜索半径,查找半径范围内与输入的音乐片断最相似的音乐文件。实验结果表明,该结构可以使系统提高60%以上的检索速度,并且搜索结果的正确率最高仍然可达80%。  相似文献   

13.
14.
In general, speech is constituted of quasi-repetitive patterns called pitches representing the speech fundamental period and tonal information of the voice. Extraction of pitch information that is crucial for many speech processing techniques, usually faces a noise problem and interference caused by high-order harmonic components. This paper introduces a novel, noise-robust method for determining speech fundamental frequency and pitch segmentation, based on a short-time energy waveform (SEW), defined as a moving average squared signal. When applying a moving average filter with a window size closed to the fundamental period, nearly repetitive patterns, with fewer ripples, synchronizing with actual pitches can clearly be observed in the SEW. The DC component in the SEW is removed using morphological top-hat and bottom-hat transforms. The fundamental frequency is determined as the frequency corresponding to the largest peak of the power spectrum of the DC-removed SEW. Finally, a time-domain window search is then performed to locate local extrema associated with pitches. Compared to traditional pitch detection techniques, the proposed technique yields pitch segmentation results with a higher rate of accuracy and greater noise robustness.  相似文献   

15.
基于小波变换和线性预测的基音提取   总被引:1,自引:0,他引:1       下载免费PDF全文
李坤  刘加 《计算机工程》2010,36(10):276-278
为有效提取基音周期,提出一种改进的小波变换方法,在小波滤波器的基础上,加入倍频抑制系数,以去除大部分的倍频干扰。根据语音情况融合阶数可调的线性预测,能去除强共振峰造成的倍频干扰,同时避免基音信号受到过多损伤。实验结果表明,在安静的环境下,该方法的准确率可达97.8%;在信噪比为0 dB时,其准确率为91.1%,从而使系统具有较好的准确性、鲁棒性和抗噪性。  相似文献   

16.
基音轨迹是语音评估中重要的参数,它的高低变化反映了语音的音高起伏和语调韵律特点。为了准确地评估一段语音,利用变长夹角链码(Alterable Included Angle Chain,AIAC)来准确提取说话者的基音轨迹,对比模仿者与标准发音的基音轨迹的相似度,研究基音轨迹相似度的匹配算法及曲线拟合算法,从而完成基音特征相似性的评估。结果表明:该方法不仅能够准确、快捷提取说话者的基音轨迹,而且计算过程简单,操作简便并能够取得良好的评估效果。  相似文献   

17.
考虑语速和前后环境的基频Target模型及实现   总被引:1,自引:1,他引:1  
本文通过一些实验和数据分析,对以音节为单位的基频target模型(认为音节的实际基频是一个有语音学意义的隐藏的目标target和前后环境作用的结果)的实现进行修正,并结合数据挖掘的方法自动得到了一个实用化的target基频模型。文中指出,音节的target必须不受语速影响,但同时受前后语言环境影响,实际的基频曲线是在前后的韵律曲线作用下向target的一个逼近过程。文章的主要任务就是如何假设一个合理的target,实现基频的target参数自动提取,最后进行基于机器学习的模型训练,成功实现了完全自动化的完整句子的基频预测和合成。集外测试结果预测的均方误差为22Hz,相关系数为0.72。  相似文献   

18.
为改善哼唱检索系统中利用旋律轮廓和节奏进行匹配的性能,提出一种新的联合音高与能量的音符切分算法。该算法改进基于自相关的基音提取算法,对提取的基音频率曲线进行后处理,并在切分过程中保持能量的分割信息,利用半音曲线的突变做切分,以提高音符切分的准确度。实验结果表明,在安静实验室环境下,该算法能获得88.75%的分割准确度。  相似文献   

19.
通过对语音转换的研究,提出了一种把源说话人特征转换为目标说话人特征的方法。语音转换特征参数分为两类:(1)频谱特征参数;(2)基音和声调模式。分别描述信号模型和转换方法。频谱特征用基于音素的2维HMMS建模,F0轨迹用来表示基音和音调。用基音同步叠加法对基音周期﹑声调和语速进行变换。  相似文献   

20.
一种基于线性预测残差倒谱的基音检测算法   总被引:2,自引:1,他引:1       下载免费PDF全文
基音检测算法一直是音频处理领域的研究热点,但是语音信号声道特征对基音及其谐振结构的影响很大,增加了检测的难度。利用LP残差仅仅保留声门激励信号的特点,通过倒谱分析避免了声道特征和噪声的影响。同时针对倒谱分析中经常出现的半频倍频问题和低频截断问题,引入了谐波积谱(HPS)的解决方案,提高了识别的精度。实验表明,该方法能够较好地避免半频倍频错误,对于截去了低频和高频的电话信道语音也能够得到令人满意的检测结果,同时作为帧检测技术能够满足实时应用的需要。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号