首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
集成搜索引擎的文本数据库选择   总被引:8,自引:0,他引:8  
用户需要检索的信息往往分散存储在多个搜索多个搜索引擎各自的数据库里,对普通用户而言,访问多个搜索引擎并从返回的结果中分辨出确实有网页是一件费时费力的工作,集成搜索引擎则可以提供给用户一个同时记问多个搜索引擎人集成环境,集成搜索引擎能将其接收到的用户查询提交给底层的多个搜索引擎进行搜索,作为一种搜索工具,集成搜索引擎具有如WEB查询覆盖面比传统引擎更大,引警有更好的可扩展性等优点,讨论了解决集成搜索引擎的数据库选择问题的多种技术,针对用户提交的查询要求,通过数据库选择可以选定最有可能返回有用信息的底层搜索引擎。  相似文献   

2.
基于用户兴趣的元搜索结果合成算法研究   总被引:1,自引:0,他引:1  
元搜索引擎将为用户提供更全面的搜索结果信息,但在庞大的搜索结果中快速找到自己感兴趣的结果并非易事.针对查询结果合成问题,提出了一种基于用户兴趣的结果合成方法,在摘要法计算用户查询与查询结果相关度的基础上引入了词条等级和用户兴趣,实现了元搜索引擎的个性化.通过程序实现此算法,分别与单个搜索引擎以及其他几种结果合成算法比较,证明此算法保证了搜索结果的查全率,又提高了查准率,大大改善了用户检索效果和效率.  相似文献   

3.
基于用户反馈的搜索引擎选择及结果归并   总被引:1,自引:0,他引:1       下载免费PDF全文
杨彬  康慕宁 《计算机工程》2007,33(24):222-224
提出一种基于用户反馈的元搜索引擎模型,通过分析用户对搜索结果的评价,利用用户的反馈信息,分别定义搜索引擎质量分值和用户评价分值。给出一种依据搜索引擎质量分值进行的搜索引擎选择策略,使元搜索引擎可以针对不同查询关键字选择准确度高的搜索引擎进行查询。设计一种主客观影响因子结合的元搜索结果归并方法,使准确率高的搜索结果先返回给用户。  相似文献   

4.
林欣  温传林  韩立新 《微机发展》2013,(2):41-43,48
元搜索引擎并行地向各个成员搜索引擎发出请求,合并及处理所有成员引擎的返回结果。相对于传统搜索引擎,元搜索引擎具有更好的查全率但在结果相关度排序及查准率方面仍需要改善。就相关度排序及查准率方面的问题元搜索成员引擎对于各个不同主题具有不同的检索质量并就此提出一种基于主题偏好的排序方法。利用Beeferman聚类方法对检索主题划分,通过Borda排序算法对元搜索引擎获得条目进行基于主题的分类排序,以此来提高元搜索查询质量和改善用户体验。  相似文献   

5.
就当前搜索引擎存在滞后性、缺乏个性化的问题给出了一种实时的、个性化的搜索引擎的Personal Intelligent Search Engine(PISE)爬虫算法.PISE可以实时地返回给用户查询结果,爬行虫根据用户输入的关键字直接到网上搜寻与之相关的信息,保证将最新结果返回给用户.爬虫算法通过一定的初始策略,运用使爬虫的搜索精益求精的思想,达到与用户的需求逐步接近的目的,从而实现搜索的智能化.实验证明PISE能够实现这一功能.  相似文献   

6.
当前主流的搜索引擎主要是以与用户查询的相关度来顺序返回搜索结果的,用户往往需要花费较长的时间从结果列表中进行选择.为了解决这个问题,针对搜索引擎返回的标题和摘要信息,构造有向图表示,并在此基础上实现了一种高效的网页聚类原型系统(efficient web clustering system,EWCS).该系统将搜索引擎返回的结果按照一定的标准分类呈现给用户,用户选择感兴趣的类别进行浏览,从而较好地满足了用户对查询速度和准确度的需求.试验结果表明该算法具有一定的可行性和较高的准确率.  相似文献   

7.
元搜索引擎结果集成算法   总被引:1,自引:0,他引:1  
对于元搜索引擎的集成方法有很多,但是多数只考虑到客观因素,而没有考虑到用户因素。不管生成的结果在数据上有多么好,只有用户在最靠前的位置找到自己需要结果的集成方法,才是好的算法。本篇文章介绍了一种新算法,该算法在考虑到用户所查询条目同独立搜索引擎返回结果的相关性和搜索引擎数据库的影响因子的情况下,加入了用户反馈因素。用户反馈因素的加入使得该算法产生的结果更贴近用户的需要,可以根据用户对所搜索出来的结果的关注程度来调整结果的排序,使排序的结果更加优化。  相似文献   

8.
基于短信的移动搜索二次排序算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张林  郭兵  张传武  沈艳 《计算机工程》2008,34(10):43-45
针对基于短信的移动搜索软件平台中的中间软件模块,提出一种能够适应多种搜索引擎的二次排序算法ISEH。该算法考虑移动终端屏幕小、存储及处理能力弱等特点,对搜索引擎第1次查询返回的结果集从内部相似度和外部热度进行综合评估,得出最终的排序结果。基于Linux平台的算法仿真实验表明,该算法能克服传统搜索引擎海量信息返回、准确度低等缺陷,将查询满意度因子提升到63.57%,并提高了移动搜索效率。  相似文献   

9.
随着互联网的高速发展,海量信息越来越多,搜索引擎技术发展很快,但是搜索引擎的搜索结果仍然不能满足人们的搜索要求,引入k-means聚类算法对Web文档进行聚类,为了提高聚类性能,引入蛙跳算法进行k值的选取.目的是提高搜索结果的准确性,增加搜索引擎返回结果与查询主题的相关性.  相似文献   

10.
基于聚类和用户兴趣分析结合的个性化元搜索   总被引:1,自引:1,他引:0  
随着Web信息的快速增长,搜索引擎已成为用户信息检索的主要工具。元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是返回的结果往往数目庞大,并且很多结果与用户查询并不相关,这直接影响了用户检索的质量并增加了用户检索的代价。本文提出一种基于聚类的个性化元搜索引擎模型,系统通过对用户建立兴趣模型,对此模型进行聚类形成不同用户群,并对检索到的结果进行聚类处理,与用户模型聚类相结合返回给用户个性化的搜索结果。  相似文献   

11.
当前对有序数列查找常用二分查找,但是二分查找具有一定的约束性和特殊情况下的低效性,为此研究并设计了索引折半查找算法,理论上其平均查找效率优于二分查找的平均查找效率。对比实验验证了索引折半查找算法的良好性能。  相似文献   

12.
机器故障查找是机器维修的一个重要环节,在搜索论的基础上提出了一种机器故障查找模型,利用启发式贪 婪算法求解该模型,并进行了实际数据验证。实验结果表明了利用该模型的  相似文献   

13.
对比研究了多种全文检索模型,实现了相应的系统原型,并通过实验对模型的检索性能进行了验证,为检索模型的选择与检索性能优化提供参考。  相似文献   

14.
互联网是一个巨大的信息资源库,其内容包罗万象,覆盖了不同学科、不同领域、不同地域、不同语言的信息资源;在这个信息海洋中,如何准确、迅速地找到并获得自己所需的信息呢"工欲善其事,必先利其器。"这就需要掌握有关的检索工具以及使用的方法和技巧。通过以百度地图搜索等为例,介绍相关网络信息检索工具以及如何在短时间内能够掌握利用和运用Internet的资源找到自己所需要信息的方法。  相似文献   

15.
Theoretical comparisons of search strategies in branch-and-bound algorithms   总被引:1,自引:0,他引:1  
Four known search strategies used in branch-and-bound algorithms-heuristic search, depth-first search, best-bound search, and breadth-first search-are theoretically compared from the viewpoint of the performance of the resulting algorithms. Heuristic search includes the other three as special cases. Since heuristic search is determined by a heuristic functionh, we first investigate how the performance of the resulting algorithms depends onh. In particular, we show that heuristic search is stable in the sense that a slight change inh causes only a slight change in its performance. The best and the worst heurstic functions are clarified, and also discussed is how the heuristic functionh should be modified to obtain a branch-and-bound algorithm with an improved performance. Finally, properties and limitations of depth-first search, best-bound search, and breadth-first search viewed as special cases of heuristic search are considered. In particular, it is shown that the stability observed for heuristic search no longer holds for depth-first search.  相似文献   

16.
传统信息检索技术满足了人们一定的需要,由于其通用的性质,仍不能满足不同背景、不同目的和不同时期的查询请求.个性化服务技术就是针对这个问题而提出的,它为不同用户提供不同的服务,以满足不同的需求.个性化服务通过收集和分析用户信息来学习用户的兴趣和行为,从而实现主动推荐的目的.个性化服务技术能充分提高站点的服务质量和访问效率,从而吸引更多的访问者  相似文献   

17.
Search engines continue to struggle with the challenges presented by Web search: vague queries, impatient users and an enormous and rapidly expanding collection of unmoderated, heterogeneous documents all make for an extremely hostile search environment. In this paper we argue that conventional approaches to Web search -- those that adopt a traditional, document-centric, information retrieval perspective -- are limited by their refusal to consider the past search behaviour of users during future search sessions. In particular, we argue that in many circumstances the search behaviour of users is repetitive and regular; the same sort of queries tend to recur and the same type of results are often selected. We describe how this observation can lead to a novel approach to a more adaptive form of search, one that leverages past search behaviours as a means to re-rank future search results in a way that recognises the implicit preferences of communities of searchers. We describe and evaluate the I-SPY search engine, which implements this approach to collaborative, community-based search. We show that it offers potential improvements in search performance, especially in certain situations where communities of searchers share similar information needs and use similar queries to express these needs. We also show that I-SPY benefits from important advantages when it comes to user privacy. In short, we argue that I-SPY strikes a useful balance between search personalization and user privacy, by offering a unique form of anonymous personalization, and in doing so may very well provide privacy-conscious Web users with an acceptable approach to personalized search.  相似文献   

18.
与传统的以网页页面集合的方式呈现搜索结果不同,实体搜索的结果是实体或实体集合,其优点是无需用户在纷杂的网页里面进行二次查找,更能提升用户的搜索体验.实体搜索的任务可以分为相关实体搜索和相似实体搜索.本文对近年来这两类任务的实体搜索技术进行综述.首先给出了实体搜索的形式化的定义,并介绍了常用的评测指标;然后对两种不同形式的实体搜索任务在两类数据源(非结构化数据集和结构化数据集)上的主要研究方法进行详细阐述和对比;最后对未来的研究内容和发展方向进行了探讨和展望.  相似文献   

19.
随着Internet的迅速发展,传统的搜索引擎在覆盖度、查询精度、可扩展性和用户多样化需求等方面存在许多不足。本文详细介绍了多搜索引擎技术,以及在该技术基础上实现的多搜索引擎系统。多搜索引擎系统通过集成目前流行的多个搜索网站,提供更强大的搜索功能,帮助用户更快速更有效地获得所需信息。  相似文献   

20.
本文在对广度优先迷宫搜索算法和深度优先迷宫搜索算法进行了仔细比较与探讨之后,提出一种新的算法:目标优先法。即每次向下一个位置搜索时,按当前位置的各方向靠近目标点的距离去选择方向。使得搜索过程在较短时间内能够快速从入口向出口目标逼近。然后从数据输入输出,程序设计等方面讲述了这种带优先级的算法的实现。并将此算法用Java语言在JDK上实现其搜索过程的画面,模拟其算法实现过程。最后,将此算法与传统的广度优先和深度优先算法优缺点进行了综合比较。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号