首页 | 本学科首页   官方微博 | 高级检索  
     

基于Lucene的英汉跨语言信息检索
引用本文:陈士杰,张玥杰. 基于Lucene的英汉跨语言信息检索[J]. 计算机工程, 2005, 31(13): 62-64
作者姓名:陈士杰  张玥杰
作者单位:复旦大学计算机科学与工程系,上海,200433;复旦大学计算机科学与工程系,上海,200433
基金项目:国家自然科学基金资助项目(60203010)
摘    要:描述了一个英汉跨语言检索系统的设计与实现,其主要研究目的在于寻找更为有效的英汉查询翻译方法,以及提高汉语检索系统的性能。在英汉查询翻译方面,以英汉双语词典为基础,建立了查询翻译算法。在汉语检索方面,分析不同索引单元对于检索性能的影响,基于Lucene全文索引工具包建立了搜索引擎。在系统评测方面,提出了一种根据主题,快速构建评测数据的方法。

关 键 词:信息检索  跨语言信息检索  自然语言处理  机器翻译
文章编号:1000-3428(2005)13-0062-03

English-Chinese Cross-language Information Retrieval Using Lucene System
Chen Shijie,Zhang Yuejie. English-Chinese Cross-language Information Retrieval Using Lucene System[J]. Computer Engineering, 2005, 31(13): 62-64
Authors:Chen Shijie  Zhang Yuejie
Abstract:The paper describes the implementation of an English-Chinese cross-language information retrieval system (CLIR). It focuses on finding effective translation equivalents between English and Chinese, and improving the performance of Chinese IR. On English-Chinese CLIR, it adopts query translation as the dominant strategy, and utilizes English-Chinese bilingual dictionary as the important knowledge resource to acquire correct translations. On Chinese monolingual retrieval, it investigates the use of different entities as indexes and implements retrieval system based on the Lucene toolkit. On system evaluation, it presents a quick method to construct the sets of relevant documents for query topics.
Keywords:Information retrieval (IR)  Cross-language information retrieval (CLIR)  Natural language processing (NLP)  Machine translation (MT)  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号