首页 | 本学科首页   官方微博 | 高级检索  
     

基于多模型融合的人名翻译系统
引用本文:庞薇,徐波. 基于多模型融合的人名翻译系统[J]. 中文信息学报, 2009, 23(1): 44
作者姓名:庞薇  徐波
作者单位:1. 中国科学院 自动化研究所 数字内容技术研究中心,北京 100190;
2. 中国科学院 自动化研究所 模式识别国家重点实验室, 北京 100190
基金项目:国家高技术研究发展计划(863计划) 
摘    要:该文提出了一种基于加权有限状态转化器(WFST)的多模型融合人名翻译框架。该框架以两个基于字符的转换模型和两个基于发音的转换模型为核心,通过加权有限状态转换器将多模型进行融合实现对人名的翻译。与单个模型相比,该文提出的方法的优势在于通过从各种信息源得到的数据价值的最大化。实验结果表明,基于多模型融合方法的人名翻译的错误率比单一模型的人名翻译的错误率降低了7.14%。

关 键 词:计算机应用  中文信息处理  多模型融合  音译  命名实体  加权有限状态转换器
  

Chinese-English Back-Transliteration of Human Name Based on Multiple Models
PANG Wei,XU Bo. Chinese-English Back-Transliteration of Human Name Based on Multiple Models[J]. Journal of Chinese Information Processing, 2009, 23(1): 44
Authors:PANG Wei  XU Bo
Affiliation:1. Digital Content Technology Research Center, Institute of Automation, Chinese Academy of
Sciences, Beijing 100190, China; 2. National Laboratory of Pattern Recognition, Institute of Automation,
Chinese Academy of Sciences, Beijing 100190, China
Abstract:This paper proposes a novel framework for Chinese-English name back-transliteration based on multiple models by using weighted finite-state transducers(WFST).Two grapheme-based models and two phoneme-based models are kernel of this framework.Combining those models with unified framework of WFST,we can build a system for Chinese-English name back-transliteration.Compared with single-model systems,the advantage of this method lies in combining those information from different models and maximizing the data av...
Keywords:computer application  Chinese information processing  multiple model combination  transliteration  named entity  WFST  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号