首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
在文本检索过程中,排序算法一定程度上影响到搜索引擎的质量。论文首先分析了Lucene组织结构,包括建立索引,检索索引文件以及结果集排序的工作过程和原理,着重剖析了Lucene基于向量模型的排序算法,并在原有排序算法基础上,采用基于关键词加权方式改进了全文检索的排序结果。实验结果证明,改进后的排序算法提高了系统的结果精确度,满足了项目的实际需求。  相似文献   

2.
在文本检索过程中,排序算法一定程度上影响到搜索引擎的质量。论文首先分析了 Lucene 组织结构, 包括建立索引,检索索引文件以及结果集排序的工作过程和原理,着重剖析了Lucene基于向量模型的排序算法, 并在原有排序算法基础上,采用基于关键词加权方式改进了全文检索的排序结果。实验结果证明,改进后的排序 算法提高了系统的结果精确度,满足了项目的实际需求。  相似文献   

3.
电力企业有着大量的自有资源,而且越来越成为企业运营的重要支撑。本文通过对Lucene开放源码全文搜索工具包的研究,实现了覆盖全企业资源的知识搜索引擎,为企业建立知识管理支持平台提供了可行的技术解决方案,为企业更有效地利用知识资源提供了有效途径。  相似文献   

4.
电力企业有着大量的自有资源,而且越来越成为企业运营的重要支撑。本文通过对Lucene开放源码全文搜索工具包的研究,实现了覆盖全企业资源的知识搜索引擎,为企业建立知识管理支持平台提供了可行的技术解决方案,为企业更有效地利用知识资源提供了有效途径。  相似文献   

5.
目的 针对目前国内房产信息资源比较分散特点,研究房产信息垂直搜索引擎的建立模式与实现技术.方法 应用Lucene与Nutch平台以及垂直搜索引擎技术,开发具有市场应用价值的房产信息垂直搜索引擎.结果 设计建立了包含网页抓取模块、网页解析模块、数据库存储模块、索引建立模块、查询模块组成的房产信息垂直搜索引擎.结论 该房产信息垂直搜索引擎可为用户提供房源信息、房产新闻和数据的检索、查询与分析等服务.相比其他搜索引擎在搜索结果方面精度提高一倍,在运作成本方面仅为其他搜索引擎运作成本的1/2,搜索速度方面相比其他搜索引擎提高20%.  相似文献   

6.
针对通用搜索引擎在专业检索方面查准率低的问题,设计了基于Lucene和Nutch组件的服装专业搜索引擎.该系统结合专业词库对抓取的网页进行分词和专业相关度计算并进行网页过滤,依据改进的网页排序算法对结果进行排序.  相似文献   

7.
基于XML的网络课件环境中搜索引擎的实现   总被引:3,自引:0,他引:3  
在网络课件中加入信息搜索功能有利于方便学习者快速定位欲学习内容。首先介绍了基于Java的英文全文索引引擎Lucene,然后分析了现有的中文切分技术,最后给出了针对课件文件特点改进的中英文搜索引擎的实现方法。  相似文献   

8.
基于Carrot2聚类的垂直搜索引擎的研究与实现   总被引:1,自引:0,他引:1  
给出了一个基于Nutch的垂直搜索引擎系统的实现,主要探讨了基于Lucene和Carrot2的信息检索与聚类的实现,并对分词、垂直信息采集等的实现进行了说明。  相似文献   

9.
论述了中文搜索引擎的工作原理,分析了中文搜索引擎存在的主要问题,讨论了中文搜索引擎的发展方向及其中一些主要技术。  相似文献   

10.
Lucene是一个用Java语言写的优秀的全文索引引擎工具包。分析了Lucene的系统结构及检索原理,并且用一个实例来说明如何实现全文检索,为应用开发提供了一种增加全文搜索的方法。最后提出了采用接口的方式来统一处理html、pdf、word和Excel等多种常用文档的思路。  相似文献   

11.
介绍了Lucene全文索引及检索技术,包括它的组成结构和检索机制,提出了一个基于Lucene进行全文检索的方案.最后用一个实例进行了说明.  相似文献   

12.
介绍了Lucene全文索引及检索技术,包括它的组成结构和检索机制,提出了一个基于Lucene进行全文检索的方案.最后用一个实例进行了说明.  相似文献   

13.
能够快速有效地检索网络上或站内大量的各种信息资源,是提供高质量检索服务的基础.CLucene是Lucene的C++版本的实现,它是一个优秀的开源全文本搜索技术框架.分析了CLucene的系统结构,详解了CLucene中的索引和检索机制,在CLucene的基础上,解决了对WORD文档的文本抽取问题,增加了CLucene的...  相似文献   

14.
基于Lucene的全文检索引擎的研究与应用   总被引:1,自引:1,他引:0  
Lucene是一个用Java语言写的优秀的全文索引引擎工具包。分析了Lucene的系统结构及检索原理,并且用一个实例来说明如何实现全文检索,为应用开发提供了一种增加全文搜索的方法。最后提出了采用接口的方式来统一处理html、pdf、word和Excel等多种常用文档的思路。  相似文献   

15.
分析了建立数字化公文数据库的必要性,阐述了Lucene技术在建立数字化公文数据库全文检索系统中具备的优势,介绍了应用Lucene技术实现数字化公文全文检索的整个流程及关键技术.  相似文献   

16.
利用Lucene开源全文本搜索技术框架建立全文检索系统,在Lucene原有的快速索引访问,多用户访问支持,跨平台使用等优点的基础上,对其中的中文分词及结果排序算法等关键技术加以改进.改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息.  相似文献   

17.
高校教师教学资源业务系统不仅是教师管理资源的重要手段,还是为学生提供学习资源的重要平台。要在海量的教学资源中快速地获取所需的资料必须在系统中加入全文检索的支持,实时检索是全文检索的一种重要需求,合理的设计实时检索方案是提高检索效率的重要手段。  相似文献   

18.
基于Lucene实现了一个海量数据库全文检索的原型。把关系数据库引入了本系统,可针对不同类型的源数据库灵活配置,比采用配置文件更加灵活;采用多线程,通过动态机制来实现不同类型源数据库中记录的抽取、转换、建立索引;提供定时自动更新索引的功能;提供多种检索方式。  相似文献   

19.
用户在使用关键词搜索时,对于一些不熟悉的领域,无法给出准确的关键词.为了解决这个问题,该文在开源全文检索工具包Lucene的基础上,设计并实现了搜索关键词辅助系统,对用户的当前查询结果进行分词处理,利用TF-IDF算法计算关键词的权重,将权重较大的关键词返回给用户,然后用户从中选择期望的关键词,再次提交给搜索引擎进行搜索.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号