首页 | 本学科首页   官方微博 | 高级检索  
     

汉语普通话语音合成语料库TH-CoSS的建设和分析
引用本文:蔡莲红,崔丹丹,蔡锐.汉语普通话语音合成语料库TH-CoSS的建设和分析[J].中文信息学报,2007,21(2):94-99.
作者姓名:蔡莲红  崔丹丹  蔡锐
作者单位:清华大学 计算机科学与技术系,北京 100084)
基金项目:国家高技术研究发展计划(863计划)
摘    要:本文介绍了汉语语音合成语料库TH-CoSS的建设和分析。本语料库包括男女声朗读语句约2万个。语料库分为四个部分: TTS系统建库用语句、TTS系统测试用语句、特殊语调语句和特殊音节组。语料设计考虑了语料的平衡和音段、韵律信息的丰富。语料库中除了文本、语音数据外,还带有音段切分标志,标注文件采用XML格式。为了方便语音分析与开发,特研制了标注软件。本文还给出了语境特征对语音韵律影响的分析结果。

关 键 词:计算机应用  中文信息处理  语音合成  汉语  语料库  
文章编号:1003-0077(2007)02-0094-06
收稿时间:2006-05-18
修稿时间:2006-07-19

TH-CoSS, a Mandarin Speech Corpus for TTS
CAI Lian-hong,CUI Dan-dan,CAI Rui.TH-CoSS, a Mandarin Speech Corpus for TTS[J].Journal of Chinese Information Processing,2007,21(2):94-99.
Authors:CAI Lian-hong  CUI Dan-dan  CAI Rui
Affiliation:Key Lab. of Pervasive Computing, Ministry of Education, Department of Computer,
Tsinghua University, Beijing 100084, China
Abstract:
Keywords:computer application  Chinese information processing  speech synthesis  Chinese  corpus
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号