首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 111 毫秒
1.
随着信息化水平不断提高,如何从海量信息中快速查找到所需内容成为当前研究的热点。在分析了全文检索基本原理及Lucene系统结构的基础上,提出了MVC模式的全文检索模型,并实现了一套基于SSH框架技术和Lucene搜索引擎的全文检索系统。该系统扩展了检索文档支持的类型,不仅可以对TXT、MS Office各类文档进行检索,还能对PDF、HTML、RTF等文档进行检索;改进了中文分词器,提高了中文分词效率与精确度;改善了人机交互方式,实现了类似百度、谷歌搜索显示功能,对搜索关键字进行高亮显示。系统应用情况表明,该系统创建索引效率高,具有较快的检索速度以及较全的检索结果。  相似文献   

2.
海量异构文档的快速检索和细粒度、多维度控制信息的存取是面向行业应用的文档管理系统中的关键。本文利用Lucene.net开源全文检索引擎和Oracle数据库,设计并实现了一个基于B/S架构,能够保存文档密级、分类等多种信息文档组织与检索系统,实现了对海量异构文档数据的快速检索和存取,并实现了文档数据的逐文档按角色分等级权限管理。  相似文献   

3.
针对工建设领域信息公开系统信息检索的需求,在Lucene的基础上,设计并实现了近实时的全文检索系统,核心模块包括语言处理模块、索引管理模块和检索模块。通过研究Lucene的内部原理,对中文分词IKAnalyser扩展同义词。  相似文献   

4.
Lucene是一个纯Java实现的高性能、可扩展的全文信息检索工具库,可以很方便地把它融入到应用程序中来增加索引和搜索功能。该文分析了Lucene的索引机制,探讨了Heritrix的结构框架,最后结合实际实例对基于Lucene的全文检索的应用进行深入研究。  相似文献   

5.
基于Lucene的站内搜索设计与实现   总被引:2,自引:0,他引:2  
简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势.该模型引入更好的中文分词技术,可自定义最终结果的排序.能够保证检索的前100条记录最符合检索者的需要.  相似文献   

6.
Lucene是一款优秀的开源全文本搜索技术框架。首先介绍高性能的全文检索工具Lucene,详细分析Lucene的系统结构、程序运行逻辑和各个模块功能,以及在Lucene上的扩展;然后针对Lucene在不同类型文档解析方面的不足,提出一种通用的文档解析器框架,并给出具体的应用实例。  相似文献   

7.
在对Lcuene技术的深入分析的基础上,设计和实现了基于Lucene的期刊全文检索平台。主要包括系统设计思路,开发平台,数据库的建设,算法,索引器、检索器和检索平台的实现。  相似文献   

8.
分析全文搜索引擎的基本结构及原理,并使用开源工具Heritrix作为搜索引擎的爬虫负责下载Web页面、HTMLParser抽取Web页面的内容、Lucene提供索引和搜索服务,采用B/S模式实现一个全文搜索引擎。  相似文献   

9.
随着互联网的迅猛发展,用户在信息海洋里查找自己所需的信息,就像大海捞针一样,搜索引擎技术恰好解决了这一难题。论文首先简单的介绍了全文检索的原理,然后重点讲解了compass搜索引擎在全文检索系统中的具体应用。  相似文献   

10.
探讨Lucene体系结构,比较了几种中文分词技术,利用Lucene建立索引,检索索引和利用Struts框架来显示结果.针对构建全文检索中的优化提出了建议。通过一个试验展示了搜索结果。试验表明使用Lucene可以快速而准确的检索结果。  相似文献   

11.
随着计算机相关硬件普及和用户计算机水平的提高,对各种公文进行电子化归档已经成为可能。为了实现这一功能,提高公文管理的效率和电子化存档工作的发展,基于Delphi和Oracle设计并实现了一个电子公文管理系统。在介绍了系统模块结构的基础上,重点讨论了系统实现涉及的若干关键技术,并通过大量实验对系统的功能和性能进行了验证。实验结果和实际应用表明,设计实现的电子公文管理系统易用高效,能够提高公文管理的效率,具有较高的理论意义和应用价值。  相似文献   

12.
本文利用Oracle Text全文检索技术,根据数据库业务逻辑构建了关键词表,通过为关键词表建立索引的方式进行检索,提高了检索效率;以ViusalC++6为开发平台,采用C/S结构技术研发了多类型文档资料管理系统,实现了办公文档资料的高效管理.  相似文献   

13.
在Lucene的全文检索中,直接对PDF文档进行全文检索几乎是不可能的。在实际应用中又需要对大量的PDF文档进行检索,通过Xpdf工具先对PDF文档转换为TXT文本,然后对TXT文本建立索引,在进行检索时通过文件名实现和原始PDF文档的一一对应,最终实现PDF文档的全文检索功能,同时还能实现对PDF文档所检索的包含关键词的内容进行高亮显示,实现全文检索的功能,通过实际项目应用,检索效果能够达到很好的效果。  相似文献   

14.
公告平台经过多年的建设与发展,已经积累了数量庞大的产品数据,其中检测报告数据库中已经存储了大约230余万份检测报告,然而目前对于该部分数据尚未形成有效的检索手段。本文为公告检测报告数据库设计基于Lucene框架的全文检索引擎,实现基于内容的全文检索服务。本项工作对于丰富公告检测报告的检索方式和提高检索效率,规范公告管理,提升政府和企业对公告服务的满意度具有重要的现实意义。  相似文献   

15.
基于用户自定义结构的电子档案管理系统设计与实现   总被引:1,自引:0,他引:1  
在对事业单位档案管理业务进行分析的基础上,完成电子档案管理系统的设计与实现。提出一种电子档案管理系统的用户自定义结构的解决方案,并给出基于C#的具体实现。系统的自定义功能可以让用户自己量身定制。制定符合用户自身需求的电子档案结构,为用户提供丰富的数据录入和收集手段,系统不仅可以录入介质档案,而且能够将用户过去录入的档案条目自动转换入库。  相似文献   

16.
基于Berkeley DB的文献检索设计与实现   总被引:1,自引:0,他引:1  
该文基于开放源码的BerkeleyDB嵌入式数据库,采用不支持事务的BerkeleyDBConcurrentDataStore配置,实现了科学文献的全文检索和组合字段检索功能。该检索系统有着低开销,高效率的优点。为了进一步进行比较,文章还设计实现了基于Oracle数据库的检索方案。从实验结果来看,前者无论在开销还是检索效率上都远远优于后者,完全可适用于中大规模的各种检索应用。  相似文献   

17.
为了推动物资计划工作前延,深入前期项目管理,精准物资需求,协同项目管理和物资管理,建立预警和提醒机制,支撑公司物资全供应链高效运转,实现物资里程碑体系管理,为此设计并实现了电力物资管理系统。该系统分为年度物资计划、物资需求计划、物资供应计划三大主要模块。  相似文献   

18.
基于Lucene的搜索引擎设计与实现   总被引:14,自引:0,他引:14  
当今搜索引擎已经成为人们在网上搜索信息的重要工具。通用的搜索引擎虽然功能强大,但对具有很多子网站的企业门户网站进行搜索时响应速度慢,索引范围不全。Lucene是一个强大的全文索引引擎工具包,应用它可以快速地开发一个搜索引擎。文中描述了利用基于Java的全文检索工具包Lucene开发定制的中文搜索引擎方法,并且将该定制的搜索引擎与Google的站内搜索进行试验比较,发现在对具有很多子网站的企业门户网站进行搜索时有优于Google的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号