期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

何凌黄华刘肖珩《计算机工程与设计》2013,34(7)

为了合成更为自然的情感语音,提出了基于语音信号声学韵律参数及时域基音同步叠加算法的情感语音合成系统.实验通过对情感语音数据库中生气、无聊、高兴和悲伤4种情感的韵律参数分析,建立4种情感模板,采用波形拼接语音合成技术,运用时域基音同步叠加算法合成含有目标感情色彩的语音信号.实验结果表明,运用波形拼接算法,调节自然状态下语音信号的韵律特征参数,可合成较理想的情感语音.合成的目标情感语音具有明显的感情色彩,其主观情感类别判别正确率较高. 相似文献

2.

情感语音合成中韵律参数的基频研究

王敬华刘建银张国燕赵新想《小型微型计算机系统》2013,34(9)

在语音合成技术的研究中,情感语音合成是当前研究的热点.在众多研究因素中,建立恰当的韵律模型和选取好的韵律参数是研究的关键,它们描述的正确与否,直接影响到情感语音合成的输出效果.为了攻克提高情感语音自然度这一难点,对影响情感语音合成技术韵律参数进行了分析,建立了基于关联规则的情感语音韵律基频模型.本文通过研究关联规则、改进数据挖掘Apriori算法并由此来获得韵律参数中基频变化规则,并为情感语音合成的选音提供指导和帮助. 相似文献

3.

基于PAD情感模型的可训练语音合成研究

陈雁翔龙润田《模式识别与人工智能》2013,26(11):1019-1025

情感语音合成是情感计算和语音信号处理研究的热点之一,进行准确的语音情感分析是合成高质量情感语音的前提.文中采用PAD情感模型作为情感分析量化模型,对情感语料库中的语音进行情感分析和聚类,获得各情感PAD参数模型.由HMM语音合成系统合成的情感语音,通过PAD模型进行参数修正,使得合成语音的情感参数更加准确,从而提高情感语音合成的质量.实验表明该方法能较好地提高合成语音的自然度和情感清晰度,在同性别不同说话人中也能达到较好的性能. 相似文献

4.

基于Tacotron模型的油田射孔语音合成方案

杜睿山陈思路李阳张可佳杨丽波解红涛宋欣雨《系统仿真技术》2020,(4):231-234

射孔施工作业是油田开采的关键步骤之一.针对油田射孔操作依赖井场人工操控的局限,将语音合成技术应用到油田射孔操作中,实现了射孔设备远程操作.在油田射孔操作指令数据集的基础上,实现姿势指令与操作指令的映射,并使用Tacotron模型的深度学习算法设计语音合成系统,通过梅尔频谱、梅尔倒谱距离等的实验对比分析,结果表明方案的有... 相似文献

5.

人脸语音动画中基于PSOLA的情感语音合成系统

王华樊养余《计算机应用研究》2012,29(3):1002-1004

提出一种基于时域基音同步叠加TD-PSOLA算法的情感语音合成系统。根据情感语音库分析总结情感规则,在此基础上利用TD-PSOLA算法对中性语音的韵律参数进行改变,并提出一种能够对基频曲线尾部形状改变的方法,使句子表达出丰富的情感。实验表明,合成出的语音具有明显的情感色彩,证明了该系统能以简单明了的方式实现情感语音的合成,有助于提高人脸语音动画表达的丰富性和生动性。相似文献

6.

深度学习语音合成技术研究

张小峰谢钧罗健欣俞璐《计算机时代》2020,(9):24-28

相似文献

7.

基于WaveNet的端到端语音合成方法

邱泽宇屈丹张连海《计算机应用》2019,39(5):1325-1329

针对端到端语音合成系统中Griffin-Lim算法恢复相位信息合成语音保真度较低、人工处理痕迹明显的问题,提出了一种基于WaveNet网络架构的端到端语音合成方法。以序列映射Seq2Seq结构为基础,首先将输入文本转化为one-hot向量,然后引入注意力机制获取梅尔声谱图,最后利用WaveNet后端处理网络重构语音信号的相位信息,从而将梅尔频谱特征逆变换为时域波形样本。实验的测试语料为LJSpeech-1.0和THchs-30,针对英语、汉语两个语种进行了实验,实验结果表明平均意见得分(MOS)分别为3.31、3.02,在合成自然度方面优于采用Griffin-Lim算法的端到端语音合成系统以及参数式语音合成系统。相似文献

8.

深度学习语音合成技术综述

张小峰谢钧罗健欣杨涛《计算机工程与应用》2021,57(9):50-59

语音合成技术在人机交互中扮演着重要角色,深度学习的发展带动语音合成技术高速发展.基于深度学习的语音合成技术在合成语音的质量和速度上都超过了传统语音合成技术.从基于深度学习的声码器和声学模型出发对语音合成技术进行综述,探讨各类声码器和声学模型的工作原理及其优缺点,在此基础上对语音合成系统进行综述,系统综述经典的基于深度学... 相似文献

9.

汉语语音合成中的一种声调修正方法

王兵苏恩泽《计算机工程》1996,22(1):6-8

提出一种汉语音的声调修正方法，该方法由声调规则的应用和声调平滑两部分组成。方方法在我们研制的基于基音同步叠加的语间合成系统中使用在改善合成语句的自然度和可度方面取得了较好的效果。相似文献

10.

基于韵律特征辅助的端到端语音识别方法

刘聪万根顺高建清付中华《计算机应用》2023,43(2):380-384

针对传统的语音识别系统采用数据驱动并利用语言模型来决策最优的解码路径,导致在部分场景下的解码结果存在明显的音对字错的问题,提出一种基于韵律特征辅助的端到端语音识别方法,利用语音中的韵律信息辅助增强正确汉字组合在语言模型中的概率。在基于注意力机制的编码-解码语音识别框架的基础上,首先利用注意力机制的系数分布提取发音间隔、发音能量等韵律特征;然后将韵律特征与解码端结合,从而显著提升了发音相同或相近、语义歧义情况下的语音识别准确率。实验结果表明,该方法在1 000 h及10 000 h级别的语音识别任务上分别较端到端语音识别基线方法在准确率上相对提升了5.2%和5.0%,进一步改善了语音识别结果的可懂度。相似文献

11.

Prosodic Phrasing: Machine and Human Evaluation

M. Céu Viana Luís C. Oliveira Ana I. Mata 《International Journal of Speech Technology》2003,6(1):83-94

This paper describes a set of experiments aiming at the construction and evaluation of a new phrasing module for European Portuguese text-to-speech synthesis, using classification and regression trees learned from hand-labelled texts. Using the assessment criteria of matching boundary predictions against the corresponding labelled ones, the best solution achieves an overall performance of 91.9%, with 86.3% of correctly assigned breaks and 4.3% of false insertions. Although in absolute terms such scores may be considered surprisingly good given the size of the training set, the total number of exact matches at the sentence level is much lower (22%). This suggested a more formal experiment to test the acceptability of the predicted phrasing in the judgement of human evaluators. As the model was not trained on a labelled speech corpus but on hand-labelled texts, the reference phrasing needed also to be assessed. The evaluation experiment involved 90 participants who were asked to grade both the automatic and the reference phrasings, and also to express their opinion on where the breaks should be placed. As expected, the results showed a large variability among the subjects in their acceptance of a specific sentence partition, and criteria had to be defined to summarise the data from the different evaluators. With the adopted criteria, the performance of the automatic assignment procedure at the sentence level is better rated by human evaluators than by simple matching with the reference corpus (78% vs. 22%, respectively). 相似文献

12.

基于FD—PSOLA算法的语音合成分析方法 总被引：3，自引：0，他引：3

郑新春柴佩琪《微型电脑应用》2001,17(7):26-29

介绍了一种基于FD－PSOLA算法来实现汉语韵律特征的修改。在短时信号频域修改的过程中,通过同态滤波处理分离了频谱包络和激励源频谱,并通过修改频率轴坐标来实现激励源频谱的压缩或拉伸。实验结果表明,FD－PSOLA算法比TD－PSOLA算法更适合于较高频率调整范围的语音合成分析。相似文献

13.

语音信号中的情感识别研究 总被引：25，自引：0，他引：25

下载免费PDF全文

赵力钱向民邹采荣吴镇扬《软件学报》2001,12(7):1050-1055

提出了从语音信号中识别情感特征的方法.从5名说话者中搜集了带有欢快、愤怒、惊奇和悲伤的情感语句共300句.从这些语音资料中提取了10个情感特征.提出了3种基于主元素分析的语音信号中的情感识别方法.使用这些方法获得了基本上接近于人的正常表现的识别效果. 相似文献

14.

神经网络在汉语两字词韵律规则学习中的应用 总被引：3，自引：0，他引：3

朱廷劭高文凌晓峰《计算机研究与发展》1999,36(6):664-667

韵律规则主要包括基频和音长变化规律,目前的韵律规则大多是通过人工得到的一些定笥描述,为了学习汉语两字词的韵律规则,文中将韵律规则看做是孤立音节语其在词中发音两者之间的映射关系,从而使用神经网络学习这种映射。文中将介绍这种方法的神经网络结构并给出实验结果。相似文献

15.

维吾尔语陈述句韵律层级停顿模型研究

努尔比娅·塔依尔艾斯卡尔·肉孜古丽娜尔·艾力地里木拉提·吐尔逊《计算机与现代化》2010,(7):180-183,187

以提高合成语音自然度为研究背景,以建立陈述句中各韵律层级时长模型为研究目的,首先制定维吾尔语韵律层级划分规则,针对已筛选的40630个典型文本句子进行各韵律层级的人工标注,利用统计方法建立各个韵律层级的时长模型。实验结果表明,本文研究思路和方法切实可行,为提高语音合成自然度打下一个坚实的基础。相似文献

16.

多基元及韵律参数匹配的维吾尔语语音合成方法

姑丽加玛丽·麦麦提艾力艾斯卡尔·肉孜艾斯卡尔·艾木都拉《计算机工程与应用》2012,48(2):116-118

音节是维吾尔语的最小发音单元,所以大部分维吾尔语语音合成系统以音节作为基本的合成单元,但维吾尔语中音节数量很大,语料库很难保证覆盖所有的音节样本,这会导致合成语音不稳定和不连续。为解决合成语音不稳定的情况,提出了结合单音素和三音素两个不同基元的单元挑选算法。通过在单元挑选模块中加入韵律参数相匹配的方法选出最佳韵律匹配的单元并解决了合成语音不连续的情况。实验结果表明,提出的方法有效地解决了合成语音不稳定和不连续的现象,从而提高了合成语音的自然度。相似文献

17.

支持重音合成的汉语语音合成系统 总被引：1，自引：1，他引：1

朱维彬《中文信息学报》2007,21(3):122-128

针对基于单元挑选的汉语语音合成系统中重音预测及实现,本文采用了知识指导下的数据驱动建模策略。首先,采用经过感知结果优化的重音检测器,实现了语音数据库的自动标注;其次,利用重音标注数据库,训练得到支持重音预测的韵律预测模型;用重音韵律预测模型替代原语音合成系统中的相应模型,从而构成了支持重音合成的语音合成系统。实验结果分析表明,基于感知结果优化的重音检测器的标注结果是可靠的;支持重音的韵律声学预测模型是合理的;新的合成系统能够合成出带有轻重变化的语音。相似文献