期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

裴定瑜柴佩琪曾令平《计算机工程》2006,32(3):223-225

以英语文语转换系统的开发为背景，采用基于大语料库的拼接语音合成方法进行英语语音合成。就英语多音节和无限词汇的特点，选用了3种不同长度的拼接单元：单词，音节，phone。引入了决策树CART（classification and regressiontree）方法对大语料库中的语音单元进行预选，并设计了相应的单元选择算法。实验表明，利用该方法能得到清晰自然的合成效果，并且提高了单元选择的效率。相似文献

2.

基于语料库的藏语语音合成单元选择算法

才让卓玛才智杰《中文信息学报》2017,31(5):59-63

在基于语料库的语音合成方法中,语音合成单元选择的优劣直接影响合成语音的自然度和流畅性。该文针对藏语言文字的特点,提出以基本构件、组合构件、字、词及句单元相融合的混合单元语音合成策略,并提出了藏语语音合成混合单元选择算法。主观评价与客观评测数据表明该策略与算法有效和合理,各类合成单元在开放语料上的覆盖率与语音合成效果均达到预期的目标。相似文献

3.

一种基于决策树模型的音库构建和基元选取方法 总被引：2，自引：1，他引：2

叶振兴蔡莲红《计算机工程》2006,32(10):189-190,220

针对嵌入式设备的存储容量小、计算能力有限的特点，设计了一种基于CART（Classification and Regression Trees）决策树模型的基元预选算法和基元选取算法，可以从原始语音语料库中挑选出最有代表性的基元样本，从而有效地降低音库规模和算法的复杂度，满足了嵌入式TFS（Text-to-Speech）系统的需要。基于以上算法，移动终端上实现了一个嵌入式中文TTS系统，实验结果表明该系统的合成语音具有较高的可懂度和自然度。相似文献

4.

基于统计声学模型的单元挑选语音合成算法

凌震华王仁华《模式识别与人工智能》2008,21(3)

提出一种基于统计声学模型的单元挑选语音合成算法.在模型训练阶段,首先提取语料库中语音数据的频谱、基频等声学参数,结合语料库中的音段和韵律标注来估计各上下文相关音素对应的统计声学模型,使用的模型结构为隐马尔柯夫模型.在合成阶段,以使目标合成句对应的声学模型具有最大的似然值输出为准则,来进行最佳合成单元的挑选,最后通过平滑连接各备选单元波形来生成合成语音.以此算法为基础,构建一个以声韵母为基本拼接单元的中文语音合成系统,并通过测听实验证明此算法相对传统算法在提高合成语音自然度上的有效性. 相似文献

5.

藏语语音合成单元选择

才让卓玛李永明才智杰《软件学报》2015,26(6):1409-1420

基于语料库的语音合成是国内外应用广泛的语音合成方法.在这种合成方法中,单元选择是语音合成的关键.通过分析藏语言文字的属性特征,设计了藏语语音合成系统模型,提出以构件、组合构件、字、词及句单元相融合的藏语语音合成方法,有效地保留了语音合成中大单元的完整性和小单元的灵活性与鲁棒性.同时,给出语音合成的单元选择策略与算法.实验数据表明:该策略与算法是有效和合理的,所选择的单元在封闭语料和开放语料上的覆盖率均达到预期目标. 相似文献

6.

基于数据驱动方法的汉语文本-可视语音合成 总被引：7，自引：0，他引：7

王志明蔡莲红艾海舟《软件学报》2005,16(6):1054-1063

计算机文本-可视语音合成系统(TTVS)可以增强语音的可懂度,并使人机交互界面变得更为友好.给出一个基于数据驱动方法(基于样本方法)的汉语文本-可视语音合成系统,通过将小段视频拼接生成新的可视语音.给出一种构造汉语声韵母视觉混淆树的有效方法,并提出了一个基于视觉混淆树和硬度因子的协同发音模型,模型可用于分析阶段的语料库选取和合成阶段的基元选取.对于拼接边界处两帧图像的明显差别,采用图像变形技术进行平滑并.结合已有的文本-语音合成系统(TTS),实现了一个中文文本视觉语音合成系统. 相似文献

7.

基于上下文音节的维吾尔语语音合成系统研究

下载免费PDF全文

麦麦提艾力·吐尔逊《计算机工程与应用》2011,47(31):141-143

提出上下文音节为拼接单元,生成自然语音的一种维吾尔语语音合成方法。上下文音节有效地整合了邻近音节内外的音联现象,可以避免大部分协同发音影响。采用基于时域平滑技术对合成语音进行平滑处理,减少在拼接点处的语音失真和突变,从而提高了合成语音的自然度。相似文献

8.

基于Tacotron模型和韵律修正的情感语音合成方法

张昕胡航烨曹欣怡王蔚《数据采集与处理》2022,37(4):909-916

语音合成技术日趋成熟,为了提高合成情感语音的质量,提出了一种端到端情感语音合成与韵律修正相结合的方法。在Tacotron模型合成的情感语音基础上,进行韵律参数的修改,提高合成系统的情感表达力。首先使用大型中性语料库训练Tacotron模型,再使用小型情感语料库训练,合成出具有情感的语音。然后采用Praat声学分析工具对语料库中的情感语音韵律特征进行分析并总结不同情感状态下的参数规律,最后借助该规律,对Tacotron合成的相应情感语音的基频、时长和能量进行修正,使情感表达更为精确。客观情感识别实验和主观评价的结果表明,该方法能够合成较为自然且表现力更加丰富的情感语音。相似文献

9.

一种基于Straight的语音焦点合成方法 总被引：1，自引：0，他引：1

杨金辉易中华王煦法《计算机工程》2005,31(13):46-47,128

针对汉语焦点的特性,设计了接近自然语流风格的实验语料。通过对语料的分析,运用CART技术,建立了焦点的韵律模型。在语音合成阶段,使用韵律模型生成语音的韵律参数,结合Straight算法,实现了语音焦点的合成。对合成效果的评测表明,该方法能够合成自然度很高的语音焦点。相似文献

10.

维吾尔语拼接式语音合成方法研究

麦麦提艾力·吐尔逊吾守尔·斯拉木《数字社区&智能家居》2006,(11):194-194,202

首先简要介绍语音合成技术的总体概念及研究状况，然后提出用不同长度的单元进行拼接的维吾尔语语音合成方法。该方法能更好地利用自然语流的原始信息．提高合成语音的自然度，同时也能提高系统的灵活性。相似文献