首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 187 毫秒
1.
分析了建立数字化公文数据库的必要性,阐述了Lucene技术在建立数字化公文数据库全文检索系统中具备的优势,介绍了应用Lucene技术实现数字化公文全文检索的整个流程及关键技术.  相似文献   

2.
基于Lucene全文检索引擎的应用与改进   总被引:2,自引:0,他引:2  
Lucene全文检索技术以其开放源代码的良好特性、优异的索引结构、有效的系统架构获得了广泛的应用.分析了Lucene的系统组织结构与核心类,同时指出其检索算法中的不足.给出了一个基于Lucence全文检索技术的信息导航系统中的设计.最后特别针对检索算法中的不足,设计和实现了利用PageRank算法的检索器.  相似文献   

3.
全文检索作为现代信息检索技术的一个重要分支,不仅是处理非结构化数据的重要工具,也是搜索引擎的主流技术之一。本文首先从全文搜索引擎模型入手,对其基本工作原理和流程进行深入研究,并结合这些知识研究开源检索引擎包Lucene的架构原理及其开发应用方法。然后介绍中文分词和基本算法及Lucene的相关技术。  相似文献   

4.
介绍了Lucene全文索引及检索技术,包括它的组成结构和检索机制,提出了一个基于Lucene进行全文检索的方案.最后用一个实例进行了说明.  相似文献   

5.
随着文献资料应用的日益广泛,全文检索系统已成为文献资料管理系统的重要部分。针对文献资料管理的需要,提出了基于Lucene的文献全文检索系统的设计与实现方案。首先对全文检索、Lucene和J2EE等技术进行研究,然后进行了系统的功能设计和结构分析,最后进行了系统的编程实现和对比测试。系统采用J2EE架构开发,实现了文献资料的管理、存储、索引和检索功能,满足了文献资料的管理和检索要求。对比测试结果表明:相对数据库查询方式,本系统具有明显的时间和资源优势。  相似文献   

6.
介绍了Lucene全文索引及检索技术,包括它的组成结构和检索机制,提出了一个基于Lucene进行全文检索的方案.最后用一个实例进行了说明.  相似文献   

7.
针对非结构化的海量文档获取困难的问题,设计和开发了基于云存储的网络文档共享系统。该系统采用了Hadoop和Lucene以及Mahout来实现对文档存储、全文检索和推荐。通过测试证明,网络文档共享系统可以使用户更快速高效地获取文档。  相似文献   

8.
Lucene是一个用Java语言写的优秀的全文索引引擎工具包。分析了Lucene的系统结构及检索原理,并且用一个实例来说明如何实现全文检索,为应用开发提供了一种增加全文搜索的方法。最后提出了采用接口的方式来统一处理html、pdf、word和Excel等多种常用文档的思路。  相似文献   

9.
基于Lucene的全文检索引擎的研究与应用   总被引:1,自引:1,他引:0  
Lucene是一个用Java语言写的优秀的全文索引引擎工具包。分析了Lucene的系统结构及检索原理,并且用一个实例来说明如何实现全文检索,为应用开发提供了一种增加全文搜索的方法。最后提出了采用接口的方式来统一处理html、pdf、word和Excel等多种常用文档的思路。  相似文献   

10.
在文本检索过程中,排序算法一定程度上影响到搜索引擎的质量。论文首先分析了Lucene组织结构,包括建立索引,检索索引文件以及结果集排序的工作过程和原理,着重剖析了Lucene基于向量模型的排序算法,并在原有排序算法基础上,采用基于关键词加权方式改进了全文检索的排序结果。实验结果证明,改进后的排序算法提高了系统的结果精确度,满足了项目的实际需求。  相似文献   

11.
用户在使用关键词搜索时,对于一些不熟悉的领域,无法给出准确的关键词.为了解决这个问题,该文在开源全文检索工具包Lucene的基础上,设计并实现了搜索关键词辅助系统,对用户的当前查询结果进行分词处理,利用TF-IDF算法计算关键词的权重,将权重较大的关键词返回给用户,然后用户从中选择期望的关键词,再次提交给搜索引擎进行搜索.  相似文献   

12.
能够快速有效地检索网络上或站内大量的各种信息资源,是提供高质量检索服务的基础.CLucene是Lucene的C++版本的实现,它是一个优秀的开源全文本搜索技术框架.分析了CLucene的系统结构,详解了CLucene中的索引和检索机制,在CLucene的基础上,解决了对WORD文档的文本抽取问题,增加了CLucene的...  相似文献   

13.
基于Lucene实现了一个海量数据库全文检索的原型。把关系数据库引入了本系统,可针对不同类型的源数据库灵活配置,比采用配置文件更加灵活;采用多线程,通过动态机制来实现不同类型源数据库中记录的抽取、转换、建立索引;提供定时自动更新索引的功能;提供多种检索方式。  相似文献   

14.
为了改进传统的文本检索技术存在检索文件格式种类单一,索引大数据量文件速度慢,甚至造成内存溢出等问题,基于Lucene系统及相关技术,研究了基于合并因子的多种格式文件索引技术,并在此基础上构建了中文文本信息检索系统.实验分析表明,本系统有效地实现了多种格式文件检索功能,通过合并因子的设定有效提高了索引速度,系统可靠性高.  相似文献   

15.
平行四边形限制最短路径算法及其在交通网络中的应用   总被引:5,自引:0,他引:5  
现有的最短路径搜索算法如D ijkstra算法或椭圆限制的D ijkstra算法等计算效率较低,有待进一步改进。作者在椭圆限制的D ijkstra算法基础上,通过对椭圆进行线性化处理和对限制用的多边形进行优选,得出一种平行四边形限制的最短路径算法,使搜索效率有了较大程度的提高,通过对各种算法的运行结果进行对比,证明了本算法的有效性和快速性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号