基于Lucene的搜索引擎的研究与应用 |
| |
引用本文: | 张俊,李鲁群,周熔.基于Lucene的搜索引擎的研究与应用[J].微机发展,2013(6):230-232. |
| |
作者姓名: | 张俊 李鲁群 周熔 |
| |
作者单位: | 上海师范大学信息与机电工程学院 |
| |
基金项目: | 国家自然科学基金资助项目(60473092) |
| |
摘 要: | 互联网搜索的精确性一直是衡量搜索引擎性能的重要标志。针对普通搜索引擎的固有缺陷,文中提出了一种应用于新闻检索的搜索引擎。该引擎是利用开源的网络爬虫工具将互联网信息抓取到本地,并利用Lucene开放的API,对特定的信息进行索引和搜索。Lucene是基于Java开发的源代码开放的全文检索工具包,具有高性能、可扩展等特性,是实现搜索引擎的核心组件。通过对Lucene的API进行分析,并在此基础上,构建了索引和搜索的模块,并对网上新闻内容进行实时地搜索。通过与普通搜索引擎对比,该新闻搜索引擎提高了搜索的精确性。
|
关 键 词: | Lucene 网络爬虫 索引 搜索 新闻搜索引擎 |
本文献已被 CNKI 等数据库收录! |
|