首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
周凤丽  林晓丽 《微机发展》2012,(1):140-142,160
互联网的快速发展也使搜索引擎不断的发展着,而搜索引擎逐渐转向商业化运行,使得搜索引擎的技术细节越来越隐蔽。文章研究和分析了搜索引擎工具Lucene的原理、模型和索引器,设计了一个搜索引擎系统。该系统采用了非递归的方式负责Web站点的网页爬取以及爬取过程中URL链接的存储、处理等,并通过多线程技术管理多个抓取线程,实现了并发抓取网页,提高了系统的运行效率。最后采用JSP技术设计了一个简易的新闻搜索引擎客户端,系统可以稳定运行,基本符合搜索引擎原理的探索,具有一定的现实意义。  相似文献   

2.
本文介绍了搜索引擎发展过程中出现的一种新技术——多元搜索引擎。分析了多元搜索引擎的现状,并对典型的多元搜索引擎系统进行了介绍。同时提出了多元搜索引擎发展过程中有待改进的一面。  相似文献   

3.
研究基于航信的日历搜索引擎(CS)系统,针对日历搜索引擎系统计算量大、响应速度慢、重复计算的问题,提出了一种利用Memcached对计算单元结果进行缓存的方法,基于此方法对系统架构进行重新设计,并对日历搜索引擎系统进行性能优化。实验结果显示该优化方案减少了系统响应时间,使系统性能得到了大幅度的提升,为民航运价领域中日历搜索引擎系统的优化提供了方法和理论支持。  相似文献   

4.
搜索引擎技术的新发展—多元搜索引擎系统   总被引:21,自引:0,他引:21  
在分析传统搜索引擎技术所存在不足的基础上,介绍了搜索引擎发展过程中出现的一种新技术-多元搜索引擎,深入分析了多元搜索引擎系统的组成结构。详细地考察了多元搜索引擎的发展状况,并对多元搜索引擎的系统指标进行了完整的评价。  相似文献   

5.
随着互联网的迅猛发展,信息爆炸出现在人们面前,如何快速、方便、有效地从信息的海洋中找到需要的信息逐渐成为越来越重要的问题,搜索引擎也应需而生.按照搜索引擎的"全、准、快、好"评测标准,目前的许多搜索引擎已经不能满足人们的需求,存在很多问题.针对这一问题,设计了一个应用于中英文法律信息检索的搜索引擎系统.搜索引擎系统的设计涉及多种关键技术,而索引是搜索引擎的核心,搜索引擎后台工作的目的就是要建立关键词和文档的索引.建立高效、快速、优化的索引结构会对搜索引擎的性能产生决定性的影响.通过对索引系统功能模块的分析,引入了索引系统的设计问题.围绕索引系统关键词同步和文档同步,提出了一种适用于中英文法律信息检索的搜索引擎索引系统同步模块的设计方法与PHP程序实现,并通过实验数据分析其优劣.  相似文献   

6.
针对目前全文搜索引擎中存在的查准率较低、不能充分满足专业用户对搜索引擎的搜索需求的问题,设计一种基于元搜索技术的垂直搜索引擎系统结构。利用关联规则挖掘用户关注度较高的信息,提取这些信息中与关键词相关的隐形关键词,并用于扩展搜索。设计基于多关键词组搜索的改进的元搜索引擎位置排序算法。实验结果表明,与以前搜索引擎系统相比,该系统的专业相关度有了一定提高。  相似文献   

7.
孟峰  荆诚 《工矿自动化》2019,(3):103-108
针对目前已有的煤矿运维系统功能单一、自动化程度低等问题,将全文搜索引擎应用到煤矿运维系统中,通过搜索引擎从故障解决方案数据库中搜索出匹配的解决方案。介绍了煤矿运维系统流程及故障解决方案来源、数据结构和录入流程;通过对比选型,选择Elasticsearch作为煤矿运维系统的全文搜索引擎,并给出了其具体应用方法。实例分析及测试结果表明,该搜索引擎提供的搜索结果与告警内容所反映的故障相关度较高,能够为解决故障提供有效帮助。  相似文献   

8.
随着互联网的飞速发展和目前传统搜索引擎存在的各种弊端,个性化搜索引擎的出现成为了一个必然;同时随着信息过载问题的出现,个性化推荐系统也已成为了不少领域关注的热点。本文将个性化推荐系统与个性化搜索引擎相结合,将推荐模式引入个性化搜索引擎中,研究并设计一个基于模式推荐的个性化搜索引擎。  相似文献   

9.
本文首先通过对搜索引擎工作机制的描述来对现有的搜索引擎做了分类、然后通过各模块工作原理和技术的研究(包括下载系统、分析系统、索引系统、查询系统、日志系统)系统性的描述了垂直搜索引擎的关键技术和运作流程,并在最后展望了搜索引擎的未来发展的前进方向。  相似文献   

10.
基于本体的元搜索引擎结果排序算法研究   总被引:2,自引:1,他引:1  
介绍了本体及元搜索引擎技术,认为将本体概念引入到元搜索引擎系统中,能够实现基于同义词、近义词的查询.给出了一个基于本体的元搜索引擎系统体系结构,介绍了系统的工作原理,提出了一种改进的摘要排序算法,并重点介绍了该算法的实现.  相似文献   

11.
介绍了针对中文的搜索引擎优化技术,对网络站点的搜索引擎优化技术具有指导意义,主要方向是网络创业和企业产品的宣传营销。通过对SEO站点的域名选择、站点本身、虚拟空间稳定性、行业选择进行了阐述,指出实际操作中的一些重要注意事项。给出了中文搜索引擎优化的行业选择方法。  相似文献   

12.
在普通本科院校中,开设文献信息检索课上机实践练习有很强的必要性,它有利于提高教学质量,加强师生互动交流,使学生牢固掌握数字资源的应用。本文主要以OPAC的操作、搜索引擎理解与应用、电子期刊、电子图书与学术搜索来设计上机内容。同时指出,为保证上机实践的总体教学质量,还应建立相应的上机质量保障机制,如加强操作题目的可考查性,并要求操作题以作业形式提交等。  相似文献   

13.
搜索引擎的诞生,给信息搜集带来了极大的方便与好处。一套完备、成熟的搜索引擎的开发需要耗费大量资源,本文围绕如何快速搭建一个简易的搜索引擎展开。基于各开源组织独立研发并对外提供的搜索引擎组件与框架,本文在JBuilder开发平台上调用各组件对外提供的Java API,快速地搭建起由数据抓取、建立索引及执行搜索3大部分组成的简易的全文搜索引擎,实现网页文档类数据的抓取与保存、文本提取、索引文档及索引库的建立、基本关键词的检索等功能,并描述搜索引擎实现及运行的一般过程。  相似文献   

14.
专业性搜索引擎需要对从网上抓取的大量文件做分析和处理,需要大量的文件读写操作。通过JAVA远程方法调用(RMI)向搜索引擎提供与文件操作的相关接口,实现文件存取操作与搜索引擎的其他功能模块的分离,提高了搜索引擎的工作效率。  相似文献   

15.
一种搜索引擎的新体系结构   总被引:1,自引:0,他引:1  
通过对当前的搜索引擎性能进行分析,指出基于Pull技术的信息获取方式是影响搜索引擎数据维护效率的关键。该文将Push技术和Agend支术应用于搜索引擎设计,构造了基于Push技术的智能搜索引擎模型,并对影响其实现关键技术进行了分析。  相似文献   

16.
索引技术是搜索引擎的核心技术之一,索引技术的好坏直接影响到搜索引擎的查准率以及对用户的响应速度。Lucene是一个优秀的全文检索引擎架构,采用高度优化的倒排索引结构并支持增量索引。但在实际应用Lucene时存在一个值得关注的问题:随着被索引文件的增多,索引时间成线性增长,导致建索引的过程会影响搜索体验;在搜索引擎应用中,当索引文件量达到一定等级时,搜索引擎就遇到性能瓶颈。在深入分析和研究Lucene索引机制的基础上,采用以内存为缓冲区建索引文件的分布式并行索引技术形成了一个可扩展的搜索引擎解决方案,极大地缓解了建索引给搜索带来的瓶颈问题。  相似文献   

17.
搜索引擎综合分析   总被引:6,自引:1,他引:6  
随着互联网的广泛应用,搜索引擎成为了越来越多的用户从海量信息中获取知识必不可少的工具.说明了搜索引擎当前发展的现状,简述了搜索引擎的分类,基本原理和工作机制,重点分析了搜索引擎的检索技术及页面排序方法,最后介绍了搜索引擎面临的挑战和未来发展趋势.  相似文献   

18.
本文首先介绍了传统搜索引擎的基本原理及结构,指出了传统搜索引擎存在的不足,然后介绍了元搜索引擎的定义、运作机制及其发展的方向,在此理论的基础上提出了新一代元搜索引擎基于用户的调度改进理念,实验表明,该改进提高了用户的检索效率和质量。  相似文献   

19.
This paper describes and evaluates a unified approach to phrasal query suggestions in the context of a high-precision search engine. The search engine performs ranked extended-Boolean searches with the proximity operator near being the default operation. Suggestions are offered to the searcher when the length of the result list falls outside predefined bounds. If the list is too long, the engine specializes the query through the use of super phrases; if the list is too short, the engine generalizes the query through the use of proximal subphrases.We describe methods for generating both types of suggestions and present algorithms for ranking the suggestions. Specifically, we present the problem of counting proximal subphrases for specialization and the problem of counting unordered super phrases for generalization.The uptake of our approach was evaluated by analyzing search log data from before and after the suggestion feature was added to a commercial version of the search engine. We looked at approximately 1.5 million queries and found that, after they were added, suggestions represented nearly 30% of the total queries. Efficacy was evaluated through a controlled study of 24 participants performing nine searches using three different search engines. We found that the engine with phrasal query suggestions had better high-precision recall than both the same search engine without suggestions and a search engine with a similar interface but using an Okapi BM25 ranking algorithm.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号