首页 | 本学科首页   官方微博 | 高级检索  
     

基于自动抽取词汇信息的双语句子对齐
引用本文:刘昕,周明,朱胜火,黄昌宁.基于自动抽取词汇信息的双语句子对齐[J].计算机学报,1998,21(Z1):151-158.
作者姓名:刘昕  周明  朱胜火  黄昌宁
作者单位:清华大学智能技术与系统国家重点实验室,北京,100084;清华大学计算机科学与技术系,北京,100084
基金项目:国家自然科学基金,航天预研基金,,,,
摘    要:双语语料库句子对齐已成为新一代机器翻译研究中的一个至关重要的问题.对齐方法主要有基于长度的方法和基于词汇的方法,两者各具特点:前者实现简单、效率高,但精度低;后者精度高但实现复杂.本文提出一种新的对齐方法,首先利用基于长度的方法对文本进行粗对齐,然后在双语平行文本中确定锚点并自动抽取双语对应的关键词汇,降低了对齐问题的复杂度并减少了错误的蔓延.最后再利用所得到的词汇对应信息进行句子的对齐.这种方法融合了基于长度和基于词汇方法的优点,实验表明,它很大程度地提高了对齐的精度.

关 键 词:双语语料库  句子对齐  机器翻译
修稿时间:1996年11月7日

ALIGNING SENTENCES IN PARALLEL CORPORA USING SELF-EXTRACTED LEXICAL INFORMATION
LIU Xin,ZHOU Ming,ZHU Sheng-Huo,HUANG Chang-Ning.ALIGNING SENTENCES IN PARALLEL CORPORA USING SELF-EXTRACTED LEXICAL INFORMATION[J].Chinese Journal of Computers,1998,21(Z1):151-158.
Authors:LIU Xin  ZHOU Ming  ZHU Sheng-Huo  HUANG Chang-Ning
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号