首页 | 本学科首页   官方微博 | 高级检索  
     

无双语词典的英汉词对齐
引用本文:吕学强,吴宏林,姚天顺. 无双语词典的英汉词对齐[J]. 计算机学报, 2004, 27(8): 1036-1045
作者姓名:吕学强  吴宏林  姚天顺
作者单位:北京大学信息科学技术学院计算语言学研究所,北京,100871;东北大学信息科学与工程学院计算机软件与理论研究所,沈阳,110004
基金项目:国家自然科学基金(60083006),国家“九七三”重点基础研究发展规划项目基金(G19980305011),国家“八六三”高技术研究发展计划项目基金(2001AA114019,2001AA114210,2002AA11701008)资助
摘    要:该文提出了一种基于语料库的无双语词典的英汉词对齐模型.它把自然语言的句子形式化地表示为集合,通过集合的交运算和差运算实现单词对齐,同时还考虑了词序和重复词的影响.该模型不仅能对齐高频单词,而且能对齐低频单词,对未登录词和汉语分词错误具有兼容能力.该模型几乎不需要任何语言学知识和语言学资源,使语料库方法可独立应用.实验表明,同质语料规模越大.词对齐的正确率和召回率越高.

关 键 词:自然语言处理  双语语料库  词对齐  最小求交  最小求差

Aligning English-Chinese Words Without Bilingual Dictionary
LU Xue-Qiang ) WU Hong-Lin ) YAO Tian-Shun ) ). Aligning English-Chinese Words Without Bilingual Dictionary[J]. Chinese Journal of Computers, 2004, 27(8): 1036-1045
Authors:LU Xue-Qiang ) WU Hong-Lin ) YAO Tian-Shun ) )
Affiliation:LU Xue-Qiang 1) WU Hong-Lin 2) YAO Tian-Shun 2) 1)
Abstract:
Keywords:natural language processing  bilingual corpora  word alignment  minimum intersection  minimum difference
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号