首页 | 本学科首页   官方微博 | 高级检索  
     

双语知识库中关联实例的多策略提取机制
引用本文:张桂平,姚天顺,尹宝生,蔡东风,宋彦.双语知识库中关联实例的多策略提取机制[J].中文信息学报,2007,21(3):34-39.
作者姓名:张桂平  姚天顺  尹宝生  蔡东风  宋彦
作者单位:1. 东北大学 软件与理论研究所,辽宁 沈阳 110004;
2. 沈阳航空工业学院 人机智能研究中心,辽宁 沈阳 110034
基金项目:国家高技术研究发展计划(863计划);航空科研项目;辽宁省自然科学基金
摘    要:双语库是翻译记忆系统最重要的组成部分之一。从有限规模的双语库中提取更多的符合用户当前翻译需要的关联实例是翻译记忆技术研究的主要内容,本文首先对当前基于单一方法的实例检索算法存在的局限性进行了分析,并在对双语库进行知识化表示的基础上,提出了基于多策略的关联实例提取机制,即综合运用句子句法结构匹配、句子编辑距离计算、句子短语片段匹配、词汇语义泛化、基于扩展信息(如: 句子来源、所属专业、应用频度等信息)的优选等策略进行关联实例提取。试验结果表明,该方法有效提高了关联实例的召回数量和质量,明显改善了对用户的辅助效果。

关 键 词:人工智能  机器翻译  双语知识库  关联实例  多策略提取机制  翻译记忆  
文章编号:1003-0077(2007)03-0034-06
收稿时间:2006-12-08
修稿时间:2007-03-08

The Association Example Multi-Strategy Extraction Mechanism Based on Bilingual Knowledge Corpus
ZHANG Gui-ping,YAO Tian-shun,YIN Bao-sheng,CAI Dong-feng,SONG Yan.The Association Example Multi-Strategy Extraction Mechanism Based on Bilingual Knowledge Corpus[J].Journal of Chinese Information Processing,2007,21(3):34-39.
Authors:ZHANG Gui-ping  YAO Tian-shun  YIN Bao-sheng  CAI Dong-feng  SONG Yan
Affiliation:1. Institute of Computer Software and Theory ,Northeastern University, Shenyang, Liaoning 110004,China;
2. Human computer Intelligence Center, Shenyang Institute of Aeronautical
Engineering, Shenyang, Liaoning 110034, China
Abstract:Bilingual corpus is one of the most important parts in translation memory system.To extract more association examples which meet the present needs of users from limited scale of bilingual corpus is the main content of the research of translation memory technology.First of all,this paper analyzes the limits of the current example search method.Based on the knowledge representation of the bilingual corpus,this paper proposes multi-strategy based association example extraction mechanism,that is,to extract association example by using comprehensively the methods of tree matching,sentence edit-distance calculating,phrase chunk matching,lexicon semantic generalization,extended information based optimization(for instance,the information on sentence source,major belonged to,application frequency,etc.).Experimental results indicate that the method effectively improved the recall quantity and quality of association example and the assistant effect to users.
Keywords:artificial intelligence  machine translation  bilingual knowledge corpus  association example  multi-strategy extraction mechanism  translation memory
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号