首页 | 本学科首页   官方微博 | 高级检索  
     

基于Lucene的文本搜索引擎的设计和实现
引用本文:邹燕飞,于成尊,赵亮.基于Lucene的文本搜索引擎的设计和实现[J].计算机与现代化,2011(9):40-42,45.
作者姓名:邹燕飞  于成尊  赵亮
作者单位:1. 咸阳师范学院信息工程学院,陕西 咸阳,712000
2. 西安华为研究所,陕西西安,710075
基金项目:咸阳师范学院科研项目(07XSYK267)
摘    要:随着局域网信息的海量增长,个性化的轻量级搜索引擎已经被中、小型企业和校园关注和青睐。本文在研究搜索引擎基本原理的基础上,通过Lucene、JSP和Struts2等技术实现多种类型文件的文本内容的检索功能。测试结果表明,该系统实现了局域网内部对HTML、PDF、Word、txt等格式文件的内容提取和解析,具有开放性、可扩展、实时性和安全的特点,成功达到了预期目标。

关 键 词:搜索  提取  解析  局域网  文本

Design and Implementation of Text Search Engine Based on Lucene
ZOU Yan-fei,YU Cheng-zun,ZHAO Liang.Design and Implementation of Text Search Engine Based on Lucene[J].Computer and Modernization,2011(9):40-42,45.
Authors:ZOU Yan-fei  YU Cheng-zun  ZHAO Liang
Affiliation:ZOU Yan-fei1,YU Cheng-zun2,ZHAO Liang1(1.College of Information Engineering,Xianyang Normal University,Xianyang 712000,China,2.Huawei Xi'an Research Institute,Xi'an 710075,China)
Abstract:With the increase of information of LAN,personalization and lightweight search engine has been concerned and admired.This paper realizes the retrieval of multi-type content using Lucene,JSP,struts2 etc,after studying of the principle of search engine on local area network.Experiment proves that the system can extract and analyze text of HTML,PDF,Word,txt,besides,the system is open,extended,real-time and safe.It achieves the anticipated results successfully.
Keywords:search  extract  analyze  LAN  text  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号