首页 | 本学科首页   官方微博 | 高级检索  
     

基于双语语料库的短语复述实例获取研究
引用本文:李维刚,刘挺,李生. 基于双语语料库的短语复述实例获取研究[J]. 中文信息学报, 2007, 21(5): 112-117
作者姓名:李维刚  刘挺  李生
作者单位:哈尔滨工业大学 计算机学院 信息检索研究室,黑龙江 哈尔滨,150001
摘    要:本文提出一种基于双语语料库的短语复述实例获取方法,尤其能够很好的抽取歧义短语的复述实例。该方法通过输入一个双语短语对约束短语的语义,利用词对齐的双语语料库,构造一个双向抽取模型从中抽取双语对的复述实例。双向抽取模型通过比较每一个候选复述短语和输入短语之间的语义一致性,来确定每个候选是否成为最终的复述实例。实验结果表明,本文短语复述实例获取方法的综合准确率达到了 60% ,获取了较好的性能。

关 键 词:计算机应用  中文信息处理  复述实例  复述获取  短语复述  双语语料库  
文章编号:1003-0077(2007)05-0112-06
收稿时间:2007-04-10
修稿时间:2007-04-102007-06-29

Phrasal Paraphrase Acquisition Based on Bilingual Corpus
LI Wei-gang,LIU Ting,LI Sheng. Phrasal Paraphrase Acquisition Based on Bilingual Corpus[J]. Journal of Chinese Information Processing, 2007, 21(5): 112-117
Authors:LI Wei-gang  LIU Ting  LI Sheng
Affiliation:Information Retrieval Laboratory, Harbin Institute of Technology, Harbin Heilongjiang 150001, China
Abstract:In this paper a novel method based on bilingual corpus is proposed to extract phrasal paraphrase examples.We focus on extract paraphrases of ambiguous phrases.A bilingual pair is the original input.Then all candidate paraphrases are extracted from word aligned bilingual corpus.The bi-direction model is designed to acquire confident paraphrases according to the coherence between the candidate phrases and the input phrases.The experimental results show that the synthesis precision is about 60%.
Keywords:computer application  Chinese information processing  paraphrase example  paraphrase acquisition  phrasal paraphrase  bilingual Ccrpus
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号