首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
当今搜索引擎已经成为人们在网上搜索信息的重要工具.通用的搜索引擎虽然功能强大,但对具有很多子网站的企业门户网站进行搜索时响应速度慢,索引范围不全.Lucene是一个强大的全文索引引擎工具包,应用它可以快速地开发一个搜索引擎.文中描述了利用基于Java的全文检索工具包Lucene开发定制的中文搜索引擎方法,并且将该定制的搜索引擎与Google的站内搜索进行试验比较,发现在对具有很多子网站的企业门户网站进行搜索时有优于Google的性能.  相似文献   

2.
基于Lucene的搜索引擎设计与实现   总被引:14,自引:0,他引:14  
当今搜索引擎已经成为人们在网上搜索信息的重要工具。通用的搜索引擎虽然功能强大,但对具有很多子网站的企业门户网站进行搜索时响应速度慢,索引范围不全。Lucene是一个强大的全文索引引擎工具包,应用它可以快速地开发一个搜索引擎。文中描述了利用基于Java的全文检索工具包Lucene开发定制的中文搜索引擎方法,并且将该定制的搜索引擎与Google的站内搜索进行试验比较,发现在对具有很多子网站的企业门户网站进行搜索时有优于Google的性能。  相似文献   

3.
许昊  王跃胜 《福建电脑》2012,28(7):133-135
本文基于开源的全文索引工具Lucene,构建了FTP搜索引擎,取得了良好的实验效果。  相似文献   

4.
目前针对维文搜索引擎的研究还比较少,本文在开源项目Lucene搜索引擎的基础上,通过对数据源、分词和停用词的设置构造了一个实验性的维文搜索引擎,并针对维文的特点改进了搜索方法。在手工构造的语料上的搜索实验表明,基于前缀匹配的搜索方法改进了维文搜索引擎的效果。  相似文献   

5.
在研究垂直搜索引擎原理和开源工具Lucene等技术基础上,实现了对网络数据的抓取、分析、建立索引和检索。阐述了基于Lucene技术的索引和检索的实现方法。实验结果表明,该系统具有较高的检索效率和准确率。  相似文献   

6.
随着Web技术的迅速发展,提供个性化服务的搜索引擎技术受到用户的广泛关注,网页排序是其中的关键技术之一。本文利用PageRank算法对原有的Lucene网页排序进行了改进,设计并实现了关于手机信息搜索的个性化搜索引擎。实验结果证明,改进后的排序算法能够较好地提高信息检索的准确度,为用户带来了优于Lucene自身排序的搜索体验。  相似文献   

7.
在简要分析搜索引擎基本原理及相关技术的基础上,以校园网为实验平台,结合小型搜索引擎的个性化需求,利用Lucene开源引擎工具包的系统结构及检索原理设计并实现了一个可扩展、可复用的小型搜索引擎系统。  相似文献   

8.
《微型机与应用》2019,(11):23-28
互联网中存在大量涉恐信息,加强对这些信息的组织与利用,在防恐、反恐中起着重要的作用。针对网络涉恐信息零散情况,通过网络爬虫技术收集互联网上的涉恐信息,构建涉恐信息数据库;在此基础上,引入中文分词器进行合理粒度分词,使用Lucene构建全文搜索引擎以提升检索效率。同时,在建立索引时根据文档包含涉恐信息特征词汇的数量改变权重,查询时包含多特征词汇的涉恐信息排序更靠前。系统采用Python进行信息采集和数据结构化,使用MySQL构建涉恐信息数据库,通过Lucene构建全文检索引擎,测试表明,该引擎能够快速、准确地完成信息检索。  相似文献   

9.
赵珂  逯鹏  李永强 《计算机工程》2011,37(16):39-41
针对目前教育网庞大的FTP资源检索困难的问题,提出一种基于EdtFTPJ和Lucene的FTP搜索引擎的设计和实现方案。该方案整体上采用基于Struts1.2框架的模型-视图-控制器设计模式,数据采集模块利用基于正则表达式的有限状态自动机抓取数据,索引模块应用倒排索引方法,系统的分词算法使用基于字典的正向最大匹配中文分词法。实验结果表明,该方案具有较高的资源检索率,同时能够保证检索结果的准确性。  相似文献   

10.
朱海丰  秦杰 《福建电脑》2008,24(10):108-109
Lucene是一个开源的全文搜索引擎工具,利用Lucene的API可以较为方便的创建一个全文搜索引擎。JSF(JavaServerFaces)是一种用于构建Web应用程序的新标准Java框架。它提供了一种以组件为中心来开发Web程序的方法,从而简化了开发。本文将LuCelle和JSF结合起来实现搜索引擎。  相似文献   

11.
研究了Lucene搜索引擎框架在烟草行业的信息获取和搜索方面的系统应用。如何在异构的海量数据中获取与烟草行业相关的数据是实现烟草行业信息化管理技术的一个重要分支。通过对不同文件格式的数据处理、烟草行业相关站点的数据抓取、搜索引擎创建和数据检索四个模块框架来实现系统。Web页面基于Heritrix烟草信息数据抓取,其中的非结构化数据或者半结构化数据和不同的文件格式通过Tika工具统一转为为文本,通过Lucene对结构化和非结构化数据创建索引以实现数据检索,由此实现烟草信息搜索引擎系统的实现。  相似文献   

12.
陈勇  张汉国  成筠 《现代计算机》2009,(11):134-137
基于B/S模式的Java Web平台架构实现一个全文搜索引擎。该系统使用MySQL作为后台数据库.并采用Heritrix、Lucene等优秀的开源框架实现对某网页手机产品信息的检索。系统还利用Struts、Hibernate、Spring等流行的Java开发框架以及面向接口编程很好地实现对系统的解耦合,在前端使用具备较强UI表现功能的Extjs作为辅助实现了AJAX应用。  相似文献   

13.
Lucene搜索引擎   总被引:2,自引:0,他引:2       下载免费PDF全文
周登朋  谢康林 《计算机工程》2007,33(18):95-96,1
Lucene是一个高性能、易扩展的基于Java技术的全文信息检索工具包,它能非常方便地为各种应用程序加入全文索引和搜索功能。该文探讨了Lucene中使用的向量空间模型,分析了Lucene索引文件的结构以及搜索排序算法,讨论了Lucene的压缩算法并且通过实验验证了Lucene的建立索引的过程。  相似文献   

14.
该文在开源全文搜索引擎Lucene的基础上设计了一个结合本体与自然语言处理技术的语义检索系统。系统分析了如何对文本进行语义分析,设计了语义索引项以存储语义信息,并提出了使用语义信息的网页排序算法。  相似文献   

15.
通用搜索引擎在广泛使用的同时,也出现了搜索范围太宽泛、搜索结果中冗杂信息过多、搜索不够精确等问题。在对搜索引擎的工作原理进行深入学习之后,提出基于Lucene的企业信息垂直搜索系统,并调用百度地图API,采用Java语言编程实现该系统。  相似文献   

16.
对于一些专业网站,站内搜索非常重要。本文研究了基于Lucene技术的Web站内搜索引擎的基本实现流程,详细分析了Lucene框架、网络蜘蛛、中文分词等关键技术。并对相关的技术进行了对比。进而说明了运用Lucene进行站内搜索开发的方法。  相似文献   

17.
对于一些专业网站,站内搜索非常重要。本文研究了基于Lucene技术的Web站内搜索引擎的基本实现流程,详细分析了Lucene框架、网络蜘蛛、中文分词等关键技术。并对相关的技术进行了对比。进而说明了运用Lucene进行站内搜索开发的方法。  相似文献   

18.
采用hibernate search技术和lucene技术,设计和实现了基于数据库的站内全文搜索引擎。与基于关键字的搜索和网页搜索相比,能够对搜索内容进行细粒度的搜索控制,查全率和效率也有提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号