首页 | 本学科首页   官方微博 | 高级检索  
     

基于等价伪译词模型的无指导译文消歧研究
引用本文:刘鹏远, 赵铁军, 杨沐昀, 李壮. 基于等价伪译词模型的无指导译文消歧研究[J]. 电子与信息学报, 2008, 30(7): 1690-1694. doi: 10.3724/SP.J.1146.2007.01029
作者姓名:刘鹏远  赵铁军  杨沐昀  李壮
作者单位:哈尔滨工业大学教育部,微软语言语音重点实验室,哈尔滨150001;哈尔滨工业大学教育部,微软语言语音重点实验室,哈尔滨150001;哈尔滨工业大学教育部,微软语言语音重点实验室,哈尔滨150001;哈尔滨工业大学教育部,微软语言语音重点实验室,哈尔滨150001
基金项目:国家自然科学基金 , 国家高技术研究发展计划(863计划)
摘    要:该文提出了一种基于等价伪译词进行无指导译文消歧的方法。该方法利用源语言岐义词不同语义下目标语译文的单义同义词集合,定义并构造等价伪译词。利用等价伪译词从目标语语料中自动获取大量已标注语义的目标语实例。由这些实例得到的目标语语义知识,可直接形成该等价伪译词的语义分类器。利用Hownet可将含目标歧义词的英语实例映射成汉语词集合,然后利用这个语义分类器进行译文消歧。在国际标准语义评测集上进行的测试表明,该方法优于其余两种自动获取已标注语料的系统,且与Senseval-2 ELS上可比较的最好无指导系统的性能相当。

关 键 词:词义消歧   无指导   译文消歧   等价伪译词   目标语
收稿时间:2007-06-25
修稿时间:2008-01-25

Unsupervised Translation Disambiguation Based on Equivalent PseudoTranslation Model
Liu Peng-yuan, Zhao Tie-jun, Yang Mu-yun, Li Zhuang . Unsupervised Translation Disambiguation Based on Equivalent PseudoTranslation Model[J]. Journal of Electronics & Information Technology, 2008, 30(7): 1690-1694. doi: 10.3724/SP.J.1146.2007.01029
Authors:Liu Peng-yuan  Zhao Tie-jun  Yang Mu-yun  Li Zhuang
Affiliation:MOE-MS Key Laboratory of Natural Language Processing and Speech, Harbin Institute of Technology, Harbin 150001, China
Abstract:This paper describes an unsupervised translation disambiguation method based on the Equivalent Pseudo Translation (EPT). EPT is constructed by using non-ambiguous words of target language, which is semantically equivalent to the source ambiguous words. Sense-tagged examples are automatically extracted from a large scale Chinese corpus, by which a semantic classifier of EPT is formed. In order to apply the EPT classifier, English examples are mapped into a set of Chinese words by Hownet. This method is evaluated on the Senseval-2 framework of English lexical sample task, achieving the top performance against all other previous works which extract sense-tagged examples automatically. The results are very close to the state-of-the-art comparable unsupervised systems.
Keywords:Word sense disambiguation  Unsupervised  Translation disambiguation  Equivalent Pseudo Translation (EPT)  Target language  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《电子与信息学报》浏览原始摘要信息
点击此处可从《电子与信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号