首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
汉语语音合成中基频曲线(F0 曲线)预测是决定合成语音声调自然度的关键因素,为了使生成的基频曲线过渡自然,提出应用连接段基频曲线模式连接各音节的方法.连接段和音节基频曲线模式使用聚类、分析修正的方法获得,相互问有重叠性,应用时根据参数来确定选取区域,进行连接.通过实验过程中分析总结得到的规则确定基频曲线模式参数.实际应用于 PSOLA 语音合成系统后,经实验证明合成语音声调自然度明显提升.  相似文献   

2.
天津话语音合成系统   总被引:1,自引:0,他引:1  
本文运用时域基音同步叠加的语音合成方法,以汉语无调音节为音库的基本单元,对天津话连续语句的合成做了研究,并制做了一天津话连续语音合成系统。该系统应用变调规则,轻声规则和句型规则,对输出语句的各个音节的声调进行调整,在改善系统合成语句的自然度方面取得了一定的效果。  相似文献   

3.
音节是维吾尔语的最小发音单元,所以大部分维吾尔语语音合成系统以音节作为基本的合成单元,但维吾尔语中音节数量很大,语料库很难保证覆盖所有的音节样本,这会导致合成语音不稳定和不连续。为解决合成语音不稳定的情况,提出了结合单音素和三音素两个不同基元的单元挑选算法。通过在单元挑选模块中加入韵律参数相匹配的方法选出最佳韵律匹配的单元并解决了合成语音不连续的情况。实验结果表明,提出的方法有效地解决了合成语音不稳定和不连续的现象,从而提高了合成语音的自然度。  相似文献   

4.
汉语是音节声调语言,在连续语音合成和识别中加入声调信息有重要意义.本文对三字词声调按首字、中字和尾字音节进行特征提取,并结合声调的特点选取相应的隶属函数进行模糊化处理,结合神经网络技术进行音节声调和三字词声调识别,取得了较好的实验结果.该方法对连续语音识别中利用声调信息有参考价值.此外文中还给出了一种新的BP网络结构.  相似文献   

5.
在目前汉语语音合成常用的波形编码合成方法中,通常是以单音节作为语音合成的声音基元.但是由于合成时音节连接处往往不能很好的过渡,导致合成语音自然度不是很好.本文针对这个问题通过对汉语中协同发音现象的研究,提出了一种新的合成声音基元选取策略,在单音节合成单元基础上增加了部分自然语音中的音节连接段作为合成单元,使用该策略结合TD-PSOLA算法进行语音合成,合成语音的自然度较通常的波形合成法有了较大的提高.  相似文献   

6.
提出一种汉语音的声调修正方法,该方法由声调规则的应用和声调平滑两部分组成。方方法在我们研制的基于基音同步叠加的语间合成系统中使用在改善合成语句的自然度和可度方面取得了较好的效果。  相似文献   

7.
提出上下文音节为拼接单元,生成自然语音的一种维吾尔语语音合成方法。上下文音节有效地整合了邻近音节内外的音联现象,可以避免大部分协同发音影响。采用基于时域平滑技术对合成语音进行平滑处理,减少在拼接点处的语音失真和突变,从而提高了合成语音的自然度。  相似文献   

8.
韵律边界对言语表达的自然度和可理解度有着重要作用。韵律建模也是语音合成、语音理解中的重要方面。该文从相邻声调的相互作用角度出发,提出基于深度神经网络(DNN)及声调核声学特征的汉语韵律边界检测方法。该方法首先采用声调核部分的声学特征来计算边界检测相关参数。然后,利用深度神经网络进行建模。作为对比,实验中采用了以整个音节的声学特征为输入特征的基线系统。结果表明,只使用调核部分声学特征的系统优于使用整个音节的系统,韵律边界检测正确率相对提高了4%,这表明该文提出的汉语韵律边界检测方法的有效性。  相似文献   

9.
简要地介绍了用于语音分析合成的时城基音同步叠加算法,在此基础上提出一种汉语语音时域声调转换方法。利用这种方法可以将一种声调的语音转换为另一种声调的语音,除微小的音质降低外,仍可保持较好的语音质量。这种方法直接对语音波形进行处理,具有计算简单、能在一般微型计算机上进行实时的特点。将之用于语音合成系统,可以通过相同声韵母的音节只存储一种声调的语音数据而大大降低音库的容量;用这种方法按照汉语语句的语调变化规律来合成语句,还可以较好地改善汉语语句合成的自然度.  相似文献   

10.
汉语连续语音中声调识别的特殊性研究   总被引:1,自引:0,他引:1  
大词汇连续语识别是当前语音识别研究的主流,探讨其中声调识别的特殊是一项有意义的工作,本文从声调获取,语音分割,声调模式和声调识别等进行了研究,通过对现有研究成果的分析和总结,并结合自己的研究工作,得出了若干结论,提出了基于音节的连续语音声调识别思想。  相似文献   

11.
基于统计方法的汉语连续语音中声调模式的研究   总被引:4,自引:0,他引:4  
曹阳  黄泰翼  徐波 《自动化学报》2004,30(2):191-198
提出采用决策树的数据驱动方法,结合专家知识.从大规模语料中统计学习出连续语 音中声调模式的分布.在建立决策树的过程中,除了相邻音节的声调外.还考虑了多种可能影响 声调模式的因素,如音节声韵母发音特点的分类、音节在词中的位置等.决策树建立后,共得到 28种声调模式.通过对结果的分析发现,除了上下文的声调外,其它因素对连续语音中声调模 式的变化也有一定的影响.声调识别实验的结果证明了该方法的有效性.  相似文献   

12.
一种使用声调映射码本的汉语声音转换方法   总被引:3,自引:0,他引:3  
在使用高斯混合模型实现说话人语音频谱包络变换的同时,提出了一种汉语声调码本映射技术来进一步提高转换语音目标说话人特征倾向性的方法。从源语音和目标语音分别提取汉语单音节的基频曲线作为基频变换单元,作预处理和聚类后分别形成源、目标声调码本,根据时间对准原则建立了一个由源特征空间到目标特征空间的声调模式映射码本。声音转换实验评估了声调码本映射算法的性能。实验结果表明,该算法较好地反映出源说话人与目标说话人基频曲线之间的映射关系,改善了声音转换性能。  相似文献   

13.
汉语是一种有调语言,因此在汉语语音识别中,调型信息起着非常关键的作用。在现有的隐马尔可夫模型(Hidden Markov Model)框架下,如何有效地利用调型信息是有待研究的问题。现有的汉语语音识别系统中主要采用两种方式来使用调型信息 一种是基于Embedded Tone Model,即将调型特征向量与声学特征向量组成一个流去训练模型;一种是Explicit Tone Model,即将调型信息单独建模,再利用此模型优化原有的解码网络。该文将两种方法统一起来,首先利用Embedded Tone Model采用双流而非单流建模得到Nbest备选,再利用Explicit Tone Model对调进行左相关建模并对Nbest得分重新修正以得到识别结果,从而获得性能提升。与传统的无调模型相比,该文方法的识别率的平均绝对提升超过了3.0%,在第三测试集上的绝对提升达到了5.36%。  相似文献   

14.
基于韵律信息的连续语流调型评测研究   总被引:2,自引:2,他引:0  
汉语连续语流中的调型评测是汉语语音评测的一个重要环节,利用连续语流中韵律耦合效应和韵律结构紧密相关这一特性,以韵律词为基本建模单元,建立基于多空间概率分布的HMM调型模型(MSD-HMM),使得汉语普通话水平评测系统针对标准连续语流的调型识别率从82.0% 提升至84.6%;针对有方言背景的非标准发音,机器评分与专家评分的相关度绝对提升超过3.0%。  相似文献   

15.
Tone study is very important for Mandarin speech recognition. In this paper, a Mixture Stochastic Polynomial Tone Model (MSPTM) is proposed for tone modeling in continuous Mandarin speech. In this model the pitch contour, main representative of tone pattern, is described as a mixed stochastic trajectory. The mean trajectory is represented by a polynomial function of normalized time while the variance is time varying. Effective training and tone recognition algorithms were developed. The experimental results based on the proposed MSPTM showed 40.7% tone recognition error rate reduction relative to the traditional Hidden Markov Model (HMM) tone model. We also present a decision tree based approach to learning the tone pattern variation in continuous speech. The phonetic and linguistic factors that may affect the tone patterns were taken into consideration while constructing the tree. After the tree was established, 28 different tone patterns were obtained. We found that in addition to the tone of the neighboring syllable, Consonant/Vowel type of the syllable and the position of the syllable in the utterance also made important contributions to tone pattern variations in continuous speech. Finally, a new approach of integrating tone information into the search process at word level is discussed. Experiments on continuous Mandarin speech recognition showed that the new tone model and tone information integration method were efficient, achieving a 16.2% relative character error rate reduction.  相似文献   

16.
基音周期估计算法在声调康复训练中的应用   总被引:7,自引:0,他引:7  
汉语是一种声调语言,而声调的识别是以基音周期的估计为基础的。文章首先用LPC求残差系数,然后对残差系数求自相关周期,进而求出基音周期,再结合计算机智能诊断,提出了一套适合临床语言障碍患者进行语音诊断和康复训练的方法。  相似文献   

17.
三字词音节声调模式具有连续语音中音节声调模式的特征,声调的提取和识别远较孤立字困难。采用小波变换方法提取语音基音,用Fuzzy ARTMAP神经网络进行声调识别,获得了比BP网络更好的实验结果。分析了仿真参数对识别结果的影响,讨论了Fuzzy ARTMAP神经网络中的过拟合问题,给出了一种基于Fuzzy ARTMAP神经网络的三字词声调识别方法。  相似文献   

18.
“调素”论与普通话合成自然度的提高   总被引:5,自引:0,他引:5  
文献[1]中的“边缘调素脱落论”提出了音步内各音节合成时边缘调素脱落的一般规律,其规律较好地揭示了两字词和三字词的轻重音分布原则和连续变调的现象;本文在此基础上,进一步提出了音步间各音步合成时的“边缘调素脱落论”,该规律揭示了四字以上词的“调素”脱落规则以及轻重音分布原则,通过该规律的应用,提高了句子合成的自然度。  相似文献   

19.
探讨了如何根据维吾尔语的语言、语音特征,对维语文语转换系统的文本进行分析和研究。通过对维吾尔语的音节、词等语音要素的了解,分析音节的组成结构(基本满足规则:Usyl=C+V+C+C)和词语结构。在此基础上总结出了音节划分规则、词根词缀的划分规则以及重音、停顿和语调变化规则,为进一步实现维吾尔语语音合成系统打下坚实的基础。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号