首页 | 本学科首页   官方微博 | 高级检索  
     

解决多音字字-音转换的一种统计学习方法
引用本文:张子荣,初敏.解决多音字字-音转换的一种统计学习方法[J].中文信息学报,2002,16(3):40-46.
作者姓名:张子荣  初敏
作者单位:1.北京理工大学计算机科学与工程系2.微软亚洲研究院
摘    要:字-音转换是语音合成系统中的一个重要模块,其中多音词和以单字词形式存在的多音字读音的确定一直是个没有很好解决的问题。本文通过对大量标注有正确拼音的语料的统计,指出着重解决41个重点多音字和22个重点多音词就可基本解决字-音转换的问题。本文采用基于扩展的随机复杂度的随机决策列表方法自动提取多音字(词)的读音规则,将字-音转换的错误率由8.8‰降低到4.4‰。规则的训练和测试的材料的标注是一个耗费人力和时间的工作,而训练材料的数量和质量又直接影响最终的结果。本文提出一种半自动的语料标注流程,可以节省将近一半的人工和时间。

关 键 词:基于扩展的随机复杂度的随机决策列表  字-音转换  多音字  多音词  
修稿时间:2002年1月9日

A Statistical Approach for Grapheme-to-Phoneme Conversion in Chinese
ZHANG Zi rong,CHU Min.A Statistical Approach for Grapheme-to-Phoneme Conversion in Chinese[J].Journal of Chinese Information Processing,2002,16(3):40-46.
Authors:ZHANG Zi rong  CHU Min
Affiliation:1.Department of Computer Science and Engineering, Beijing Institute of Technology2.Microsoft Research Asia
Abstract:
Keywords:ESC  based stochastic decision list  grapheme  to  phoneme conversion  Polyphone character  Words with multi  pronunciations
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号