首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
基于Intranet的搜索引擎   总被引:3,自引:0,他引:3  
分析了Intranet的特点,指出了Intranet中搜索引擎设计的特殊性。目前Intranet上的搜索引擎存在着许多问题,提出了如何在Intranet内部搜索引擎的设计上解决这些问题。  相似文献   

2.
刘敏娜  葛萌  陈娟 《福建电脑》2009,25(5):24-25
全文检索是现代信息检索技术的一个重要分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文使用Lucene工具包开发一个具有全文搜索功能的数码产品搜索系统。该系统具有很强的实用性。  相似文献   

3.
一种全文检索系统的设计与实现   总被引:4,自引:0,他引:4  
在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统核心接口层。最后给出了该系统的一种分布式部署方案。  相似文献   

4.
站内搜索引擎是针对某个网站内部的全文检索服务,具备信息检索的核心技术。提出在文件系统上构建的解决方案,使用全文检索开发工具包——Lucene,实现站内搜索引擎系统。不仅针对关系数据库的数据,还对服务器文件系统上的各种非结构化文档数据进行加工、信息抽取,并创建索引文件进行搜索,最终实现对站内被检索数据的导航浏览,关键字高亮提示,筛选排序等。经过测试,检索效率较高,效果良好。  相似文献   

5.
基于Berkely DB的文献检索设计与实现   总被引:2,自引:0,他引:2  
该文基于开放源码的Berkeley DB嵌入式数据库,采用不支持事务的Berkeley DB Concurrent Data Store配置,实现了科学文献的全文检索和组合字段检索功能。该检索系统有着低开销,高效率的优点。为了进一步进行比较,文献还设计实现了基于Oracle数据库的检索方案。从实验结果来看,前者无论在开销还是检索效率上都远远优于后者,完全可适用于中大规模的各种检索应用。  相似文献   

6.
介绍了一个基于文档服务器的全文搜索引擎的设计及其实现,提出了一种用于企业文档服务器搜索引擎的基本框架,并对该搜索引擎主要功能模块的实现作了详细介绍,给出了相应的试验结果.系统采用文件实时动态监控和中文分词识别技术,使系统具有实时性和文档搜索有效性及准确性等优点.  相似文献   

7.
针对目前图书馆的各种电子资源都需要在各自的平台上单独检索的问题,提出构建基于搜索引擎的一站式检索平台,实现在统一的检索界面上,一次检索就能获得所有电子资源的相关文献信息,使读者能在最短的时间内获得最深入、最准确、最全面的文献信息。  相似文献   

8.
索引结构是搜索引擎的核心,直接影响着搜索引擎的检索性能。本文提出了一种新的索引结构,该结构充分利用字符串前缀个数及排列顺序的潜在规律,在查找过程中有效地重用了先前的匹配信息,提高了检索的效率。  相似文献   

9.
构建了搜索引擎系统结构,实现了在FTP文件服务器上所需资料的快速查找。设计和实现了搜索引擎的核心部分即数据搜索器、索引器、检索器、引擎控制台以及Web搜索界面五个模块。数据搜索器的分布并行多线程机制,实现了多台PC分布搜索服务策略;同时每台PC设置多线程搜索,多次尝试和断点续搜功能,保证了在网络不稳定的情况下也能够完成搜索、建库任务。索引器和检索器的双字母倒排索引机制对提高建库、索引和查找速度,效果非常明显。  相似文献   

10.
基于Berkeley DB的文献检索设计与实现   总被引:1,自引:0,他引:1  
该文基于开放源码的BerkeleyDB嵌入式数据库,采用不支持事务的BerkeleyDBConcurrentDataStore配置,实现了科学文献的全文检索和组合字段检索功能。该检索系统有着低开销,高效率的优点。为了进一步进行比较,文章还设计实现了基于Oracle数据库的检索方案。从实验结果来看,前者无论在开销还是检索效率上都远远优于后者,完全可适用于中大规模的各种检索应用。  相似文献   

11.
数据库设计是企业内网搜索引擎的核心,数据库设计的合理性,科学性及高效性对整个搜索引擎的性能起到关键的作用。明确企业内网搜索引擎数据库的要求,并分析企业内网数据库的结构,给出数据库在搜索引擎中的应用。  相似文献   

12.
搜索引擎的混合索引技术   总被引:5,自引:0,他引:5  
倒排文件是搜索引擎检索系统普遍采用的索引技术。针对中文搜索引擎中采用自动分词的全文检索因分词词典规模小导致的检索效率下降与词典规模扩大导致检索效果下降的矛盾,论文在天网搜索引擎的实践基础上,提出了一种基于倒排文件实现的混合索引的方法,它可以有效提高搜索引擎下短语查询的检索效率,同时不影响系统检索效果。  相似文献   

13.
基于Web的网络爬虫的设计与实现   总被引:2,自引:0,他引:2  
无论是站内信息检索还是特定的Web信息搜集,都离不开全文搜索引擎系统的核心模块--网络爬虫,本文详细介绍了一种设计及实现方案,包括页面搜集器和页面索引器的基本工作流程、数据存储结构、核心算法及主要的技术难点.该系统经实际运行,效果良好,最后给出了有待进一步改进的地方.  相似文献   

14.
大规模搜索引擎检索系统框架与实现要点   总被引:12,自引:0,他引:12       下载免费PDF全文
随着Web规模的不断扩大,搜索引擎正成为因特网上最常用的应用之一。本文以天网搜索为实例,分析了大规模通用型中文搜索引擎检索系统的设计与实现技术。围绕检索效率和检索效果两个方面,本文介绍天网检索系统的集成框架结构和分布式架构,并分析了索引创建和索引检索中的相关实现技术。  相似文献   

15.
搜索引擎的诞生,给信息搜集带来了极大的方便与好处。一套完备、成熟的搜索引擎的开发需要耗费大量资源,本文围绕如何快速搭建一个简易的搜索引擎展开。基于各开源组织独立研发并对外提供的搜索引擎组件与框架,本文在JBuilder开发平台上调用各组件对外提供的Java API,快速地搭建起由数据抓取、建立索引及执行搜索3大部分组成的简易的全文搜索引擎,实现网页文档类数据的抓取与保存、文本提取、索引文档及索引库的建立、基本关键词的检索等功能,并描述搜索引擎实现及运行的一般过程。  相似文献   

16.
本文首先介绍了传统搜索引擎的基本原理及结构,指出了传统搜索引擎存在的不足,然后介绍了元搜索引擎的定义、运作机制及其发展的方向,在此理论的基础上提出了新一代元搜索引擎基于用户的调度改进理念,实验表明,该改进提高了用户的检索效率和质量。  相似文献   

17.
基于Lucene的搜索引擎设计与实现   总被引:14,自引:0,他引:14  
当今搜索引擎已经成为人们在网上搜索信息的重要工具。通用的搜索引擎虽然功能强大,但对具有很多子网站的企业门户网站进行搜索时响应速度慢,索引范围不全。Lucene是一个强大的全文索引引擎工具包,应用它可以快速地开发一个搜索引擎。文中描述了利用基于Java的全文检索工具包Lucene开发定制的中文搜索引擎方法,并且将该定制的搜索引擎与Google的站内搜索进行试验比较,发现在对具有很多子网站的企业门户网站进行搜索时有优于Google的性能。  相似文献   

18.
随着搜索引擎技术的发展,元搜索引擎已经成为搜索引擎的一个重要的研究方向.介绍元搜索引擎的工作原理,对元搜索引擎和一般的元搜索引擎进行比较,指出元搜索引擎的特点,给出一种由.NET实现的元搜索引擎的系统框架,分析系统采用的关键技术.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号