首页 | 本学科首页   官方微博 | 高级检索  
     

跨语言信息检索中查询语句翻译转换算法
引用本文:张孝飞,黄河燕,陈肇雄,代六玲. 跨语言信息检索中查询语句翻译转换算法[J]. 计算机工程, 2007, 33(11): 166-167,212
作者姓名:张孝飞  黄河燕  陈肇雄  代六玲
作者单位:中国科学院计算机语言信息工程研究中心,北京,100083;中国科学院计算机语言信息工程研究中心,北京,100083;中国科学院计算机语言信息工程研究中心,北京,100083;中国科学院计算机语言信息工程研究中心,北京,100083
摘    要:跨语言信息检索中,输入的查询语句往往是一系列关键词组合,而不是一个完整意义上的句子,致使查询关键词序列缺乏必要的语法、语境信息,难以实现查询语句的精确翻译。该文基于大规模双语语料库,以向量空间模型和词汇同现互信息为理论基础,运用传统单语信息检索技术,将查询语句的翻译问题转换为查询关键词词典义项的boost值计算,重构目标语查询语句。

关 键 词:跨语言信息检索  查询语句  翻译转换  双语语料库
文章编号:1000-3428(2007)11-0166-02
修稿时间:2006-06-07

Translation Transforming Algorithm of Query Sentence in Cross Language Information Retrieval
ZHANG Xiaofei,HUANG Heyan,CHEN Zhaoxiong,DAI Liuling. Translation Transforming Algorithm of Query Sentence in Cross Language Information Retrieval[J]. Computer Engineering, 2007, 33(11): 166-167,212
Authors:ZHANG Xiaofei  HUANG Heyan  CHEN Zhaoxiong  DAI Liuling
Affiliation:(Research Center of Computer & Language Information Engineering, Chinese Academy of Sciences, Beijing 100083)
Abstract:In cross language information retrieval, the query sentence often comprises some query keywords, but not a complete sentence. Because of the lack of necessary contextual and syntactic information in the series of query keywords, it is impossible to accurately translat the query sentence. In this paper, based on large-scale bilingual corpora and theory of vector space model and lexical mutual information, traditional mono-language IR technology is applied to convert the problem of translating query sentence into computing the “boost” value of the query keyword translation in bilingual dictionary, and the target language query sentence is reconstructed.
Keywords:Cross language information retrieval   Query sentence   Translation transforing   Bilingual corpora
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号