首页 | 本学科首页   官方微博 | 高级检索  
     

大规模语音语料库及其在TTS中应用的几个问题
引用本文:章森,刘磊,刁麓弘.大规模语音语料库及其在TTS中应用的几个问题[J].计算机学报,2010,33(4).
作者姓名:章森  刘磊  刁麓弘
作者单位:北京工业大学信息与计算科学实验室,北京,100022
基金项目:国家自然科学基金(60572125)资助~~
摘    要:首先介绍了大规模语音语料库以及基于大规模语音语料库的文语转换技术的研究现状,接着介绍了一个大规模连续汉语语音语料库的实例Slib的结构和内容;在此基础上,讨论了面向大规模语音语料库的索引技术,提出了语料库检索中的集合运算和最小包容问题,证明了最小包容问题是NP完全的,给出了求解该问题的贪婪算法以及算法的近似比;最后,讨论了基于集合运算的大规模语音语料库的检索技术在文语转换系统中的应用,特别是在基本语言单位实例的选取问题上实现了一种基于最小包容的优化方法,对提高文语转换系统的自然度有实用价值.

关 键 词:语音语料库  集合运算  文语转换  最小包容  信息检索  

Problems on Large-Scale Speech Corpus and the Applications in TTS
ZHANG Sen LIU Lei DIAO Lu-Hong.Problems on Large-Scale Speech Corpus and the Applications in TTS[J].Chinese Journal of Computers,2010,33(4).
Authors:ZHANG Sen LIU Lei DIAO Lu-Hong
Affiliation:Information and Computation Mathematics Lab/a>;Beijing University of Technology/a>;Beijing 100022
Abstract:The recent advances of large-scale speech corpus (LSSC) and text-to-speech (TTS) technologies are briefly reviewed,then the architecture and annotation information of a large-scale speech corpus Slib are introduced.Based on Slib,the LSSC-oriented indexing methods is discussed,the set operations and the minimum cover problem related to information retrieval in LSSC are presented.The minimum cover problem is a NP-complete problem,and a greedy algorithm is proposed to obtain an approximation solution.The appro...
Keywords:speech corpus  set operation  text to speech  minimum cover  information retrieval  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号