首页 | 本学科首页   官方微博 | 高级检索  
     

基于Lucene的搜索引擎的研究与应用
引用本文:张俊,李鲁群,周熔.基于Lucene的搜索引擎的研究与应用[J].微机发展,2013(6):230-232.
作者姓名:张俊  李鲁群  周熔
作者单位:上海师范大学信息与机电工程学院
基金项目:国家自然科学基金资助项目(60473092)
摘    要:互联网搜索的精确性一直是衡量搜索引擎性能的重要标志。针对普通搜索引擎的固有缺陷,文中提出了一种应用于新闻检索的搜索引擎。该引擎是利用开源的网络爬虫工具将互联网信息抓取到本地,并利用Lucene开放的API,对特定的信息进行索引和搜索。Lucene是基于Java开发的源代码开放的全文检索工具包,具有高性能、可扩展等特性,是实现搜索引擎的核心组件。通过对Lucene的API进行分析,并在此基础上,构建了索引和搜索的模块,并对网上新闻内容进行实时地搜索。通过与普通搜索引擎对比,该新闻搜索引擎提高了搜索的精确性。

关 键 词:Lucene  网络爬虫  索引  搜索  新闻搜索引擎
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号