首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
基于韵律特征参数的情感语音合成算法研究   总被引:1,自引:0,他引:1  
为了合成更为自然的情感语音,提出了基于语音信号声学韵律参数及时域基音同步叠加算法的情感语音合成系统.实验通过对情感语音数据库中生气、无聊、高兴和悲伤4种情感的韵律参数分析,建立4种情感模板,采用波形拼接语音合成技术,运用时域基音同步叠加算法合成含有目标感情色彩的语音信号.实验结果表明,运用波形拼接算法,调节自然状态下语音信号的韵律特征参数,可合成较理想的情感语音.合成的目标情感语音具有明显的感情色彩,其主观情感类别判别正确率较高.  相似文献   

2.
邱泽宇  屈丹  张连海 《计算机应用》2019,39(5):1325-1329
针对端到端语音合成系统中Griffin-Lim算法恢复相位信息合成语音保真度较低、人工处理痕迹明显的问题,提出了一种基于WaveNet网络架构的端到端语音合成方法。以序列映射Seq2Seq结构为基础,首先将输入文本转化为one-hot向量,然后引入注意力机制获取梅尔声谱图,最后利用WaveNet后端处理网络重构语音信号的相位信息,从而将梅尔频谱特征逆变换为时域波形样本。实验的测试语料为LJSpeech-1.0和THchs-30,针对英语、汉语两个语种进行了实验,实验结果表明平均意见得分(MOS)分别为3.31、3.02,在合成自然度方面优于采用Griffin-Lim算法的端到端语音合成系统以及参数式语音合成系统。  相似文献   

3.
基于波形拼接的语音合成技术研究   总被引:1,自引:0,他引:1  
苏珊珊 《福建电脑》2008,24(10):104-105
本文在研究了当前最新语音合成技术的基础上,着重研究了基于波形拼接的语音合成方法,并采用基于时域平滑技术对合成语音进行平滑处理.从而减少拼接点处的语音失真和突变。最后实现了一个机场等级播报的语音合成应用,获得了较好的合成效果。  相似文献   

4.
为了实现机器能够发出声音,本文设计并搭建了HTK(HMM-Tool-Kit)平台用来实现中文语音合成系统.采用参数合成法实现了文本到语音的合成,并对合成系统中的文本分析、韵律控制以及语音合成的实现技术进行了详细的论述.最后在Linux系统下搭建环境并进行实验,得到了预期的结果,实现了文本到语音的转化.  相似文献   

5.
提出一种基于统计声学模型的单元挑选语音合成算法.在模型训练阶段,首先提取语料库中语音数据的频谱、基频等声学参数,结合语料库中的音段和韵律标注来估计各上下文相关音素对应的统计声学模型,使用的模型结构为隐马尔柯夫模型.在合成阶段,以使目标合成句对应的声学模型具有最大的似然值输出为准则,来进行最佳合成单元的挑选,最后通过平滑连接各备选单元波形来生成合成语音.以此算法为基础,构建一个以声韵母为基本拼接单元的中文语音合成系统,并通过测听实验证明此算法相对传统算法在提高合成语音自然度上的有效性.  相似文献   

6.
情感语音合成作为一个新兴的语音合成方向,糅合生理学、心理学、语言学和信息科学等各学科知识,可以应用于文本阅读、信息查询发布和计算机辅助教学等领域,能够很好地将语音的口语分析、情感分析与计算机技术有机融合,为实现以人为本,具有个性化特征的语音合成系统奠定基础。目前的情感语音合成工作可分为基于规则合成和基于波形拼接合成两类。情感语音合成研究分为情感分析和语音合成两个部分。其中.情感分析的主要工作是收集不同情感的语音数据、提取声学特征,分析声学特征与情感联系;语音合成的主要工作是建立情感转换模型,利用情感转换模型实现合成。  相似文献   

7.
基于语料库的语音合成是国内外应用广泛的语音合成方法.在这种合成方法中,单元选择是语音合成的关键.通过分析藏语言文字的属性特征,设计了藏语语音合成系统模型,提出以构件、组合构件、字、词及句单元相融合的藏语语音合成方法,有效地保留了语音合成中大单元的完整性和小单元的灵活性与鲁棒性.同时,给出语音合成的单元选择策略与算法.实验数据表明:该策略与算法是有效和合理的,所选择的单元在封闭语料和开放语料上的覆盖率均达到预期目标.  相似文献   

8.
该文介绍基于声学统计建模的语音合成技术,重点回顾中国科学技术大学讯飞语音实验室在语音合成领域这一前沿发展方向的创新性工作成果。具体包括 融合发音动作参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,改善参数语音合成器在合成语音音质上的不足。以上技术创新使得语音合成系统在自然度、表现力、灵活性及多语种应用等方面的性能都有进一步的提升,并推动语音合成技术在呼叫中心信息服务、移动嵌入式设备人机语音交互、智能语音教学等领域的广泛引用。  相似文献   

9.
赵建东  高光来  飞龙 《计算机科学》2014,41(1):80-82,104
基于隐马尔科夫模型的语音合成方法是当今语音合成的主流方法,它已被广泛应用于英语、汉语、日语等语音合成系统中。然而基于隐马尔科夫模型的蒙古语的语音合成技术研究还处于空白状态。首次将基于隐马尔科夫模型的语音合成方法用于蒙古语语音合成,并进行了语音合成实验。从最终合成系统的效果来看,合成的语音整体稳定流畅,可懂度高,而且节奏感比较强,主观平均得分为3.80。这为进一步研究基于隐马尔科夫模型的蒙古语语音合成技术奠定了基础。  相似文献   

10.
通过研究语音残差信号的合成方法,给出了一种改进的波形内插(Waveform Interpolation,WI)编码器语音重建方案,去除了解码器中特征波形(Characteristic waveform,CW)的对齐运算。在该方案中当帧间的基音周期连续变化时,语音残差信号由幅度谱和相位轨迹直接合成,而当基音周期发生跳变时,则利用相位过渡过程合成语音残差信号。该方法大大降低了WI解码器的复杂度,同时保证了合成语音质量没有变化。  相似文献   

11.
LSF滤波器的实时实现   总被引:1,自引:0,他引:1  
语音信号处理技术在全数字化通信网、综合业务数字网中起十分重要的作用。文章介绍了LSF滤波器、LSF-LPC系数转换及IIR直接型滤波器的算法描述,在DSP56L811硬件上实时实现了上述算法,通过使用多种优化手段,有效地提高了运算速度,控制了存储消费。最后给出了硬件实现与理论值的比较结果。  相似文献   

12.
Corpus based speech synthesis can produce high quality synthetic speech due to it high sensitivity to unit context. Large speech database is embedded in synthesis system and search algorithm (unit selection) is needed to search for the optimal unit sequence. Speech feature which served as target cost is estimated from the input text. The acoustic parameters which served as join cost are derived from mel frequency cepstral coefficients (MFCCs) and Euclidean distance. In this paper, a new method which is Genetic Algorithm is proposed to search for optimal unit sequence. Genetic Algorithm (GA) is a population based search algorithm that is based on the biological principles of selection, reproduction, crossover and mutation. It is a stochastic search algorithm for solving optimization problem. The speech unit sequence that has minimum join cost will be synthesized into complete waveform data.  相似文献   

13.
林朗  王让定  严迪群  李璨 《计算机应用》2018,38(6):1648-1652
随着语音技术的发展,以回放语音为代表的各种仿冒语音给声纹认证系统及音频取证技术带来了极大挑战。针对回放语音对声纹认证系统的攻击问题,提出一种基于修正倒谱特征的检测算法。首先,采用变异系数来分析原始语音和回放语音在频域上的差异;然后,有针对性地将提取梅尔倒谱系数(MFCC)过程中的Mel滤波器组换成由linear滤波器和逆Mel滤波器组合的新滤波器组,进而得到基于新滤波器组的修正倒谱特征;最后,使用高斯混合模型(GMM)作为分类器进行分类判别。实验结果表明,修正的倒谱特征能够有效地检测回放语音,其等错误率约为3.45%。  相似文献   

14.
陈修凯  陆志华  周宇 《计算机应用》2020,40(7):2137-2141
在大部分基于深度学习的语音分离和语音增强算法中,把傅里叶变换后的频谱特征作为神经网络的输入特征,并未考虑到语音信号中的相位信息。然而过去的一些研究表明,尤其是在低信噪比(SNR)条件下,相位信息对于提高语音质量是必不可少的。针对这个问题,提出了一种基于卷积编解码器网络和门控循环单元(CED-GRU)的语音分离算法。首先,利用原始波形既包含幅值信息也包含相位信息的特点,在输入端以混合语音信号的原始波形作为输入特征;其次,通过结合卷积编解码器(CED)网络和门控循环单元(GRU)网络,可以有效解决语音信号中存在的时序问题。提出的改进算法在男性和男性、男性和女性、女性和女性的语音质量的感知评价(PESQ)和短时目标可懂度(STOI)方面,与基于排列不变训练(PIT)算法、基于深度聚类(DC)算法、基于深度吸引网络(DAN)算法相比,分别提高了1.16和0.29、1.37和0.27、1.08和0.3;0.87和0.21、1.11和0.22、0.81和0.24;0.64和0.24、1.01和0.34、0.73和0.29个百分点。实验结果表明,基于CED-GRU的语音分离系统在实际应用中具有较大的价值。  相似文献   

15.
介绍了直接数字频率合成(DDS)技术的基本原理,给出了基于Altera公司FPGA器件的相位可调双路同频正弦信号发生器的设计方案,同时给出了其软件程序和试验结果。试验结果表明:该方法生成的双路同频正弦信号具有波形失真小、频率和相位精度高,且输出频率与相位可调等优点。  相似文献   

16.
为了设计高分辨率、频率切换相位连续、频率覆盖系数达到106的超低频函数信号发生器,提出了直接数字频率合成DDFS技术,可以合成频率可控的任意波形;以SOPC实现系统设计,利用FPGA实现数字逻辑功能,在LPM_ROM中放入波形数据表,用NIOSII嵌入式软核微处理器实现波形选择、数据处理,输出正弦波、方波、三角波、锯齿波并显示其频率、幅度和相位;测试表明,系统稳定,具有输出波形任意化、低频范围宽和频率精度高的特点。  相似文献   

17.
清音和浊音线谱频率(LSF)参数分布具有差异性。为了提高声码器中LSF参数的量化性能,利用胞腔均匀度(CE)能定量表征清浊音LSF参数分布的差异程度,提出了一种基于CE的清浊模式码书设计算法。该算法首先根据CE推导出清音和浊音参与训练的LSF参数的数量比;然后剔除清音中指定数量的非典型LSF参数;最后重新训练出码书。实验结果表明,在相同码率情况下,该算法较码书共享算法谱失真降低2.5%,平均意见得分提高了2.3%,码书存储量下降了21.1%,并且适用于不传输清浊音标志的声码器。  相似文献   

18.
提出了一种融合自动检错的单元挑选语音合成方法。本文方法旨在设计与主观听感更加一致的单 元挑选准则,以提高合成语音的自然度。首先利用众包网络平台快速大量地收集测听人对于合成语音的主观评价数据,取代了传统的利用具备语言学知识的专家收集主观评价数 据的方法;然后基于这些主观评价数据,提取对应语音的音节时长、单元代价以及声学参数距 离等特征,构建基于支持向量机的合成错误检测器;在合成阶段,该检测器被用来对传统单元 挑选输出的N条路径行重打分,以确定最优的单元挑选序列。倾向性测听结果表明本文方法可以有效地提高合成语音的自然度。  相似文献   

19.
针对传统单通道语音增强方法中用带噪语音相位代替纯净语音相位重建时域信号,使得语音主观感知质量改善受限的情况,提出了一种改进相位谱补偿的语音增强算法。该算法提出了基于每帧语音输入信噪比的Sigmoid型相位谱补偿函数,能够根据噪声的变化来灵活地对带噪语音的相位谱进行补偿;结合改进DD的先验信噪比估计与语音存在概率算法(SPP)来估计噪声功率谱;在维纳滤波中结合新的语音存在概率噪声功率谱估计与相位谱补偿来提高语音的增强效果。相比传统相位谱补偿(PSC)算法而言,改进算法可以有效抑制音频信号中的各类噪声,同时增强语音信号感知质量,提升语音的可懂度。  相似文献   

20.
小波阈值降噪算法中最优分解层数的自适应选择   总被引:13,自引:0,他引:13  
蔡铁  朱杰 《控制与决策》2006,21(2):217-0220
小波阚值降噪算法是一种去除数字信号中白噪声的有效算法.针对加性高斯白噪声的情况,提出一种自适应小波降噪算法,用于语音信号的增强.它能根据带噪信号的特点,自适应选择小波变换的最优分解层数.实验结果表明,该算法比经典的小波降噪算法具有更好的降噪效果,能有效提高算法的实用性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号