首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
韵律参数和频谱包络修改相结合的情感语音合成技术研究   总被引:1,自引:0,他引:1  
情感语音合成可以增强合成语音的表现力、人情味,是近年来的新兴课题.除了韵律特征之外,音质类和发声器官类参数对情感语音的表达也有着至关重要的影响,而通常的研究大多都是基于规则或者预先为某种情感设计的滤波器来进行这两类参数的修改.本文提出了通过频谱包络综合地调整音质类和发声器官类参数来合成情感语音的方法,并通过实验验证了这一方法的有效性.另外,实验结果也显示了当韵律参数和频谱包络同时得到修改时,相对于单独修改某类参数可以获得更好的情感合成效果.  相似文献   

2.
本文首先给出了可训练语音合成系统架构,然后结合维吾尔语自身的特点,研究了其在维吾尔语音合成中的应用,给出了可训练语音合成系统训练部分所需数据准备,包括文本收集,录制、音素列表的确定,不带时间和带时间标注、问题集和上下文属性集的设计等.并利用通用工具HTS进行了测试,结果表明本文技术路线的可行性和所准备数据的有效性.  相似文献   

3.
提出了2种方法实现了基于HMM的语音合成系统的模型压缩。首先通过基于地址的模型压缩进行合理的内存管理,删除冗余信息。然后通过降低语音谱参数的维数,在尽量不损失语音质量的条件下压缩模型数据。试验表明,通过以上2种方法,模型大小从293Mbyte压缩到6.98Mbyte,压缩幅度达到97.6%。同时,内存消耗及处理时间也能满足实时嵌入式应用的要求,主观评价显示合成的语音质量较高。  相似文献   

4.
情感语音合成的研究   总被引:6,自引:0,他引:6  
周洁  赵力  邹采荣 《电声技术》2005,(10):57-59,73
介绍了语音信号中的情感语音合成的方法,通过分析情感语句的语调,得到了喜、怒、惊、悲4种情感不同的变调规律,对不同的情感类型确定相应的基音频率变化规律、能量变化规律、元音的变异规律和无声时延比例变化规则。对于待合成的语音,首先进行文本扫描,再叠加相应情感的语调变化规则,利用PSOLA算法进行情感语音合成,获得了较好效果。  相似文献   

5.
中文HMM参数化语音合成系统构建   总被引:1,自引:0,他引:1  
胡克  康世胤  郝军 《通信技术》2012,45(8):101-103,108
在语音合成领域,大语料库拼接合成方式有一些固有弱点,例如语料库建设成本过高,合成稳定性差等。而基于隐马尔可夫模型(HMM)的语音合成技术在多样化语音合成、多语言支持、系统资源占用方面优势明显。分析了基于HMM的参数化语音合成技术的基本结构和核心算法,研究语料库建设,声学参数提取,建模单元和HMM拓扑结构选择等问题,给出适合于中文语音的参数设置,实现基于HMM的参数化中文语音合成。  相似文献   

6.
目前,情感语音合成自然度在情感语音合成中成为难点,本论文将数据挖掘技术应用于其中.通过对传统的Aprior算法的改进,探讨了如何提取情感语音韵律参数之间的关系,并且在理论上表明比传统Aprior算法在挖掘情感语音频繁项目集的效率高.应用这些规则,可以很方便的为以后情感语音合成系统的选音提供帮助和参考.  相似文献   

7.
基于HMM方法的动态手势轨迹训练性能研究   总被引:1,自引:0,他引:1  
基于HMM(Hidden Markov Model,隐形马尔可夫模型)对动态手势轨迹的训练是手势识别的关键技术之一。本文对HMM的模型训练采用Baum.Welch算法,并分别从迭代次数,样本个数选取,以及模型初值选取等方面对动态手势轨迹的训练性能进行了研究。实验结果表明HMM方法对具有时空特性的动态手势轨迹识别是非常有效的。  相似文献   

8.
情感语音合成作为语音合成的一个重要分支,在人机交互领域得到了广泛的关注。如何获得更好的情感嵌入并有效地将其引入到语音合成声学模型中是目前主要存在的问题。表达性语音合成往往从参考音频中获得风格嵌入,但只能学习到风格的平均表示,无法合成显著的情感语音。该文提出一种基于条件变分自编码器的端到端情感语音合成方法(Conditional Duration-Tacotron,CD-Tacotron),该方法在Tacotron2模型的基础上进行改进,引入条件变分自编码器从语音信号中解耦学习情感信息,并将其作为条件因子,然后通过使用情感标签将其编码为向量后与其他风格信息拼接,最终通过声谱预测网络合成情感语音。在ESD数据集上的主观和客观实验表明,与目前主流的方法GST-Tacotron和VAE-Tacotron相比,该文提出的方法可以生成更具表现力的情感语音。   相似文献   

9.
10.
系统选用S3C2410A处理器作为硬件平台,Linux操作系统作为软件平台,采用OV7640+OV511的结构实现图像信息采集,使用基于V4L的方法编写图像处理、检测和识别程序,实现了快速、准确识别人脸的功能;并对相关浮点算法进行了改进,极大地提高了ARM处理器上图像预处理的速度。采用基于隐马尔可夫模型(HMM)的方法,简化了人脸检测和识别的过程。  相似文献   

11.
赵晖  唐朝京 《电子与信息学报》2009,31(12):3010-3014
为了合成具有真实感的视频序列,该文提出一种基于汉语视频三音素的可视语音合成方法。根据汉语的发音规律和音素与视素的对应关系,该文提出视频三音素的概念。在此基础上,建立隐马尔可夫(HMM)训练与合成模型,在训练过程中使用了视频音频联合特征,并加入了动态特征。在合成过程中,连接视频三音素HMM模型形成句子HMM,并从中提取特征参数,合成可视语音。从主观和客观评估结果来看,合成视频的真实感强,满意度较高。  相似文献   

12.
The optimum maximum voiced frequency (MVF) estimation‐based two‐band excitation for hidden Markov model‐based speech synthesis is presented. An analysis‐by‐synthesis scheme is adopted for the MVF estimation which leads to the minimum spectral distortion of synthesized speech. Experimental results show that the proposed method significantly improves synthetic speech quality.  相似文献   

13.
周洁 《电子工程师》2011,37(1):4-8,23
随着情感信息处理的研究不断深入,语音信号中的情感转换越来越受到人们的重视。与传统的信息处理技术不同,语音的情感转换是用机器来实现理解和认识。本文首先探讨了情感的分类;接着,将语音情感转换系统分为:特征提取、参数转换和语音合成,并从特征提取和参数转换两方面进行了阐述,分析了相关的理论及算法,对各方法的优缺点进行了比较。最后,对语音情感转换研究方向进行了讨论。  相似文献   

14.
语音信号中情感特征的分析和识别   总被引:5,自引:0,他引:5  
余华  王治平  赵力 《电声技术》2004,(3):30-34,38
随着信息技术的发展,对人机交互能力的要求不断提高,情感信息处理已成为提高人机交互能力的一个重要课题。文中介绍了近年来国内外在语音信号中的情感特征分析和识别的研究概况,讨论了存在的一些问题和今后需要进一步研究的课题。  相似文献   

15.
周慧  魏霖静 《电子设计工程》2012,20(16):188-190
提出了一种基于LS-SVM的情感语音识别方法。即先提取实验中语音信号的基频,能量,语速等参数为情感特征,然后采用LS-SVM方法对相应的情感语音信号建立模型,进行识别。实验结果表明,利用LS-SVM进行基本情感识别时,识别率较高。  相似文献   

16.
提出了一种结合韵律信息的高性能汉语连续数字语音识别算法,该识别算法基于CHMM(连续隐马尔可夫模型),采用MFCC(MEL频率倒谱系数)为主要语音特征参数,结合韵律信息进行连续数字精确分割,能够有效区分易混数字。算法采用两级识别框架来提高语音识别率,其中,第1级对连续数字分割,在此基础上进行数字语音识别,输出各候选结果,第2级在候选结果中确定易混数字对,并运用韵律信息进一步选择正确结果。实验表明,最终汉语连续数字语音识别率有很大提高。  相似文献   

17.
李晔  姜竞赛  崔慧娟  唐昆 《电声技术》2010,34(6):48-50,59
受信道误码影响时,基于SELP模型的声码器合成语音出现大量刺耳的尖锐声,严重降低语音质量。研究发现,高能量的语音信号经分析滤波器产生余量信号,能量可能明显降低,量化值较小。信道误码可能使该参数在合成端出错明显增大,再经过合成滤波器后产生尖锐声。将能量参数从原始语音信号中提取,并改进合成算法中能量参数的用法。能量较高的语音信号量化值较大,发生误码时明显增大的可能性降低,能削弱尖锐刺耳声。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号