首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
文语转换系统语音库中不同长度协同发音单元的选择   总被引:1,自引:0,他引:1  
本文以我们自行开发的文语转换系统为背景,根据汉语普通话的特点,从解决协同发音角度研究了文语转换系统语音库中双音节词和三音节词的选取,以及与协同发音相关的单音的选择,我们把实验的结果应用到系统中,取得了提高合成语音自然度的效果。  相似文献   

2.
在目前汉语语音合成常用的波形编码合成方法中,通常是以单音节作为语音合成的声音基元.但是由于合成时音节连接处往往不能很好的过渡,导致合成语音自然度不是很好.本文针对这个问题通过对汉语中协同发音现象的研究,提出了一种新的合成声音基元选取策略,在单音节合成单元基础上增加了部分自然语音中的音节连接段作为合成单元,使用该策略结合TD-PSOLA算法进行语音合成,合成语音的自然度较通常的波形合成法有了较大的提高.  相似文献   

3.
探讨了如何根据维吾尔语的语言、语音特征,对维语文语转换系统的文本进行分析和研究。通过对维吾尔语的音节、词等语音要素的了解,分析音节的组成结构(基本满足规则:Usyl=C+V+C+C)和词语结构。在此基础上总结出了音节划分规则、词根词缀的划分规则以及重音、停顿和语调变化规则,为进一步实现维吾尔语语音合成系统打下坚实的基础。  相似文献   

4.
本文介绍了一个计算机实现的汉语文-语转换系统,它以词为单位,将文本按句子输出,可保持自然语言的韵律。为了改善合成语音的自然度和可理解度,我们总结了一些语言学规则,并应用于该系统中,得到了很好的测试结果。  相似文献   

5.
戴礼荣  王子祥  王仁华 《计算机工程》2004,30(17):45-46,142
提出了汉语文语转换和语音编解码的基于DSP的实时综合处理的思想。介绍了实时综合处理的基于DSP的硬件与软件实现。文章介绍的基于DSP的实时综合处理具有以下几个方面的特点:(1)在单片DSF和不超过IMB的DSP最小系统上实现了一个任意文本的汉语文语转换系统;(2)为提高语音合成的自然度,提供了灵活的语音定制功能;(3)根据通信信道容最大小,实现可灵活选择的采甩语音合成方式的语音通信和语音编码方式的语音通信;(4)基于DSP的实时综合处理的在线重构;(5)基于RS232的通用异步串口的包括命令解释引擎、合成引擎、编码引擎等的模块化DSP软件结构。  相似文献   

6.
音节是维吾尔语的最小发音单元,所以大部分维吾尔语语音合成系统以音节作为基本的合成单元,但维吾尔语中音节数量很大,语料库很难保证覆盖所有的音节样本,这会导致合成语音不稳定和不连续。为解决合成语音不稳定的情况,提出了结合单音素和三音素两个不同基元的单元挑选算法。通过在单元挑选模块中加入韵律参数相匹配的方法选出最佳韵律匹配的单元并解决了合成语音不连续的情况。实验结果表明,提出的方法有效地解决了合成语音不稳定和不连续的现象,从而提高了合成语音的自然度。  相似文献   

7.
谈谈汉语文语转换系统的发展   总被引:2,自引:0,他引:2  
本文就汉语语文语转移系统的概念、实现过程和方法作了简单的介绍,在着重分析比较了汉形合成、参数合成和按规则合成三种方法的优缺点以及国内一些研究单位在这一领域已经取得的研究成果,指出影响汉语文语转换系统性能的关键技术以及今后的重点发展方向。  相似文献   

8.
基于结构助词驱动的韵律短语界定的研究   总被引:10,自引:5,他引:5  
应宏  蔡莲红 《中文信息学报》1999,13(6):42-46,64
提高合成语音的自然度是汉语文语转换系统(CTTS)的核心任务,而韵律短语的界定扮演着重要的角色。本文通过分析虚词的特征,研究了结构助词在连续语流中的特点、地位,以及在韵律短语界定中的作用,得到了一组相应的规则和结论。  相似文献   

9.
基于统计韵律模型的汉语语音合成系统的研究   总被引:2,自引:4,他引:2  
本文论述了采用统计模型进行汉语韵律层级结构分析和韵律建模的思路,在此基础上建立了汉语语音合成系统。其中,本文还仔细阐述了韵律代价函数的构造,及其参数的自动训练算法。同时,论文还分析了韵律特征间相互作用对音节基元选取的影响,并最终实现了一个连续语流中用于汉语语音合成的音节基元选取模型。测试表明了本文提出的基于统计模型的韵律层级分析和韵律建模思路,能够较好应用于汉语语音合成系统的构造,并使之具有良好的合成语音的自然度。  相似文献   

10.
汉语文-语转换中的语言学处理   总被引:4,自引:1,他引:3  
本文介绍了一个计算机实现的汉语文-语转换系统, 它以词为单位, 将文本按句子输出, 可保持自然语言的韵律。为了改善合成语音的自然度和可理解度, 我们总结了一些语言学规则, 并应用于该系统中, 得到了很好的测试结果。  相似文献   

11.
张扬  赵晓群  王缔罡 《计算机应用》2016,36(5):1410-1414
研究汉语自然语音音节切分方法具有明显现实意义,比较准确的自然语音切分方法可以代替人工对一些拥有参照文本的语音进行标注。然而至今为止并没有完全准确的汉语语音音节切分方法。依据相同发音环境下汉语语音音节时间长度服从某种高斯分布和相邻语音音节之间存在短时能量波谷两个假设,提出了基于音节时间长度高斯拟合的汉语音节切分方法。对算法进行分析,根据初步切分短时能量波谷分散到各分语音段的特性,提出了简化算法,有效降低了该音节切分方法的时间复杂度。实验结果表明,音节切分准确度(与人工标注切分时间距离平方的均值)达到小数点后3位,在台式机Matlab环境下运算时间均不超过1 s,可以达到应用要求。  相似文献   

12.
针对目前生活中涌现的海量语音数据,人们对语音检索技术准确度的要求越来越高。主要研究了汉语连续语音检索任务中,基于转换音节网格的研究方法。针对语音检索系统中置信度计算的问题,提出了一种基于音节间互信息的置信度计算方法,并将其用于网格结构的语音检索系统中。该方法能够有效地利用上下文之间的互信息量,从而更准确、合理地描述汉语语言模型。实验结果表明,用提出的方法建立转换音节网格来进行语音检索,其检出率(FOM)比后验概率法和N-best法有较大幅度的提高。得到的汉语语音检索系统其FOM最高可以达到83.7%。  相似文献   

13.
汉语韵律词内部音节重音的强弱对总的F0曲线的特征有很大影响。本文参考生成F0曲线的数学优化模型,提出了对由孤立单音节调型曲线串接而成的汉语韵律词的F0曲线的连续性、平滑性、曲线形状、平均值进行整体优化的x2估计方法,实现了在重音作用下的F0曲线的优化。在谐波+噪声合成系统上实验研究了汉语三音节韵律词的64种不包含轻声的调型组合和10种结尾为轻声的调型组合的F0曲线的优化效果,展示优化过程中三个控制参数——平滑因子(smooth)、音节重音强度(stress)、音节F0形状失真度(Distor-tion)对F0曲线整体形状的控制效果和参数取值的有效范围。非正式的听觉实验表明合成语音的自然度有明显提高。  相似文献   

14.
Higher quality synthesized speech is required for widespread use of text-to-speech (TTS) technology, and the prosodic pattern is the key feature that makes synthetic speech sound unnatural and monotonous, which mainly describes the variation of pitch. The rules used in most Chinese TTS systems are constructed by experts, with weak quality control and low precision. In this paper, we propose a combination of clustering and machine learning techniques to extract prosodic patterns from actual large mandarin speech databases to improve the naturalness and intelligibility of synthesized speech. Typical prosody models are found by clustering analysis. Some machine learning techniques, including Rough Set, Artificial Neural Network (ANN) and Decision tree, are trained for fundamental frequency and energy contours, which can be directly used in a pitch-synchronous-overlap-add-based (PSOLA-based) TTS system. The experimental results showed that synthesized prosodic features greatly resembled their original counterparts for most syllables.  相似文献   

15.
本文提出了一种新的聚类分段算法,这个算法以段内平均离散度最小、段间平均离散度最大为准则,采用聚类的方法逐次迭代选择最佳分段断点和分段段数,能正确地对汉语语音进行音素分段,它和以往分段方法相比在性能上有很大提高.文中还给出了应用该算法对汉语单音所作的部分实验统计结果,可供进一步开展基于音素或音位的汉语语音识别研究参考.  相似文献   

16.
识别率和对环境的适应能力是一个语音识别系统的两个重要性能,常见的提高语音识别率的方法大多通过改进声音模型来获得较高的识别率,这往往造成声音模型的复杂化以及模型训练的困难。另外,在说话人和麦克风位置不固定等情况下,这些方法识别效果往往很差。文中提出了一种用多话筒分别识别一个语音,并用数据融合技术对识别结果进行处理的语音识别方法。初步的实验结果表明该方法不仅可以提高系统对环境的适应能力,而且在单个声音  相似文献   

17.
18.
Visyllable Based Speech Animation   总被引:1,自引:0,他引:1  
  相似文献   

19.
对时变性强的非平稳汉语语音信号,建议采用变时-频复子波分析方法提取汉语语音信号的幅度谱、相位谱、基音周期及共振峰信息。选择有n阶消失矩及良好的时频局域化特性的复高斯子波提取汉语语音信号的幅度谱和相位谱,实验结果表明,该方法提取的语音信号的幅度谱、相位谱和子波变换谱表征了汉语语音的音节包络、细节包络及声调,区分了清、浊音,并准确提取了语音信号的动态基音周期、估计出共振峰。这对汉语语音特征提取和识别提供了一种新的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号