首页 | 本学科首页   官方微博 | 高级检索  
     

基于Tacotron模型和韵律修正的情感语音合成方法
引用本文:张昕,胡航烨,曹欣怡,王蔚.基于Tacotron模型和韵律修正的情感语音合成方法[J].数据采集与处理,2022,37(4):909-916.
作者姓名:张昕  胡航烨  曹欣怡  王蔚
作者单位:南京师范大学教育科学学院, 南京 210097
基金项目:国家哲学社会科学基金(BCA150054)。
摘    要:语音合成技术日趋成熟,为了提高合成情感语音的质量,提出了一种端到端情感语音合成与韵律修正相结合的方法。在Tacotron模型合成的情感语音基础上,进行韵律参数的修改,提高合成系统的情感表达力。首先使用大型中性语料库训练Tacotron模型,再使用小型情感语料库训练,合成出具有情感的语音。然后采用Praat声学分析工具对语料库中的情感语音韵律特征进行分析并总结不同情感状态下的参数规律,最后借助该规律,对Tacotron合成的相应情感语音的基频、时长和能量进行修正,使情感表达更为精确。客观情感识别实验和主观评价的结果表明,该方法能够合成较为自然且表现力更加丰富的情感语音。

关 键 词:语音合成  端到端合成  韵律修正  情感语音
收稿时间:2021/7/23 0:00:00
修稿时间:2021/10/27 0:00:00

Expressive Speech Synthesis Method Based on Tacotron Model and Prosodic Correction
Zhang Xin,Hu Hangye,Cao Xinyi,Wang Wei.Expressive Speech Synthesis Method Based on Tacotron Model and Prosodic Correction[J].Journal of Data Acquisition & Processing,2022,37(4):909-916.
Authors:Zhang Xin  Hu Hangye  Cao Xinyi  Wang Wei
Affiliation:College of Education Science, Nanjing Normal University, Nanjing 210097, China
Abstract:
Keywords:speech synthesis  end-to-end synthesis  prosodic correction  emotional speech
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号