首页 | 本学科首页   官方微博 | 高级检索  
     

基于多粒度的英汉人名音译
引用本文:于恒,涂兆鹏,刘群,刘洋.基于多粒度的英汉人名音译[J].中文信息学报,2013,27(4):16-22.
作者姓名:于恒  涂兆鹏  刘群  刘洋
作者单位:1. 中国科学院 计算技术研究所 智能信息重点实验室,北京 100190;
2. 清华大学 计算机科学与技术系,北京 100084
基金项目:国家863重大项目资助
摘    要:音译是解决人名翻译的重要方法。在英汉人名音译问题中,翻译粒度问题一直是研究的重点之一。该文提出一种基于多粒度的英汉人名音译方法。将多种粒度的英文切分通过词图进行融合,并使用层次短语模型进行解码,从而缓解了由于切分错误而导致的音译错误,提高了系统的鲁棒性。实验结果表明基于多粒度的音译方法融合了基于各种粒度音译方法的优点,在准确率上提高了3.1%,在BLEU取得了2.2个点的显著提升。

关 键 词:人名音译  多粒度  词图  

Lattice-based Multi-granularity Name-Entity Machine Transliteration
YU Heng , TU Zhaopeng , LIU Qun , LIU Yang.Lattice-based Multi-granularity Name-Entity Machine Transliteration[J].Journal of Chinese Information Processing,2013,27(4):16-22.
Authors:YU Heng  TU Zhaopeng  LIU Qun  LIU Yang
Affiliation:1. Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China;
2. Department of Computer Science and Technology, Tsinghua, Beijing 100084, China
Abstract:Machine Transliteration is an important approach for Name-Entity translation. In English to Chinese transliteration, the translation granularityis of great importance.In this paper we introduce a Multi- granularitymachine transliteration method. We use word lattice to combine multiple syllable segmentation, and decode with hierarchical phrase-based translation model. Experimental results show that our method combines the advantage of different granularityand improve the robustness of the system.We achieve an improvement of 3.1% on precision, and 2.2 points on BLEU over the baseline system.
Key wordsname entity machine transliteration; multi-granularity; word-lattice
Keywords:name entity machine transliteration  multi-granularity  word-lattice
本文献已被 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号