首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 271 毫秒
1.
集成搜索引擎的文本数据库选择   总被引:8,自引:0,他引:8  
用户需要检索的信息往往分散存储在多个搜索多个搜索引擎各自的数据库里,对普通用户而言,访问多个搜索引擎并从返回的结果中分辨出确实有网页是一件费时费力的工作,集成搜索引擎则可以提供给用户一个同时记问多个搜索引擎人集成环境,集成搜索引擎能将其接收到的用户查询提交给底层的多个搜索引擎进行搜索,作为一种搜索工具,集成搜索引擎具有如WEB查询覆盖面比传统引擎更大,引警有更好的可扩展性等优点,讨论了解决集成搜索引擎的数据库选择问题的多种技术,针对用户提交的查询要求,通过数据库选择可以选定最有可能返回有用信息的底层搜索引擎。  相似文献   

2.
陈海燕  徐峥  张辉 《计算机科学》2016,43(2):277-282
搜索引擎的一个标准是不同的用户用相同的查询条件检索时,返回的结果相同。为解决准确性问题,个性化搜索引擎被提出,它可以根据用户的不同个性化特征提供不同的搜索结果。然而,现有的方法更注重用户的长时记忆和独立的用户日志文件,从而降低了个性化搜索的有效性。获取用户短时记忆模型来提供准确有效的用户偏好的个性化搜索方法被广泛采用。首先,根据基于查询关键词的相关概念生成短期记忆模型;接着,基于用户的时序有效点击数据生成用户个性化模型;最后,在用户会话中引入了遗忘因子来优化用户个性化模型。实验结果表明,所提出的方法可以较好地表达用户信息需求,较为准确地构建用户的个性化模型。  相似文献   

3.
XML数据包含丰富的语义信息,但现有的大多数XML搜索引擎并未利用这一信息.如何利用XML数据的语义信息提高检索质量已成为当前研究所关注的问题.设计并实现了一个基于语义相关的XML关键字搜索引擎:Ropeway. 对于用户给定的关键字,Ropeway分析了XML数据的语义和用户信息需求,推断用户的查询主题,然后从XML数据中搜索与该主题相关的结果,并根据主题相似度对结果进行排序.结果证明: Ropeway具有良好的检索性能.  相似文献   

4.
当用户向XML检索引擎提交查询后,返回的结果通常远远多于用户的期望,返回结果中难免有一些不相关的文档或结点.对于以文档为中心的XML文档集合,XML片段检索是根据用户的查询,从XML检索引擎返回的XML文档或结点中抽取出仅包含数百字节的片段,用户可以通过该片段判断片段所在的XML文档或结点与查询的真实相关性,以决定是否有必要进一步阅读,从而有效地提高从XML文档中获取信息的效率.该文提出了基于结点权重模型的XML片段检索策略.该策略先利用结点权重模型ATG(平均主题概括强度)对XML文档集中的标签或路径设置权重,再将该权重用于BM25模型,得到BM25NW检索模型.在利用BM25NW检索出XML结点后,对结点中定长窗口进行评分,考察其是否适合作为片段内容.最后在保证信息冗余较小的条件下,选择得分较高的窗口内容组成片段返回给用户.INEX 2011片段检索任务上的评测结果显示,基于结点权重模型ATG的XML片段检索策略具有很强的竞争力,性能明显优于其它参赛系统.  相似文献   

5.
基于用户反馈的搜索引擎选择及结果归并   总被引:1,自引:0,他引:1       下载免费PDF全文
杨彬  康慕宁 《计算机工程》2007,33(24):222-224
提出一种基于用户反馈的元搜索引擎模型,通过分析用户对搜索结果的评价,利用用户的反馈信息,分别定义搜索引擎质量分值和用户评价分值。给出一种依据搜索引擎质量分值进行的搜索引擎选择策略,使元搜索引擎可以针对不同查询关键字选择准确度高的搜索引擎进行查询。设计一种主客观影响因子结合的元搜索结果归并方法,使准确率高的搜索结果先返回给用户。  相似文献   

6.
基于聚类和用户兴趣分析结合的个性化元搜索   总被引:1,自引:1,他引:0  
随着Web信息的快速增长,搜索引擎已成为用户信息检索的主要工具。元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是返回的结果往往数目庞大,并且很多结果与用户查询并不相关,这直接影响了用户检索的质量并增加了用户检索的代价。本文提出一种基于聚类的个性化元搜索引擎模型,系统通过对用户建立兴趣模型,对此模型进行聚类形成不同用户群,并对检索到的结果进行聚类处理,与用户模型聚类相结合返回给用户个性化的搜索结果。  相似文献   

7.
林欣  温传林  韩立新 《微机发展》2013,(2):41-43,48
元搜索引擎并行地向各个成员搜索引擎发出请求,合并及处理所有成员引擎的返回结果。相对于传统搜索引擎,元搜索引擎具有更好的查全率但在结果相关度排序及查准率方面仍需要改善。就相关度排序及查准率方面的问题元搜索成员引擎对于各个不同主题具有不同的检索质量并就此提出一种基于主题偏好的排序方法。利用Beeferman聚类方法对检索主题划分,通过Borda排序算法对元搜索引擎获得条目进行基于主题的分类排序,以此来提高元搜索查询质量和改善用户体验。  相似文献   

8.
搜索引擎的目的在于快速有效地找到用户需求的信息,在黄页搜索引擎中,通过关键字搜索,可以返回大量的信息,但其中的大部分信息不在用户需求的范围内.二次检索的定义是,在一次检索结果的基础上,按照特定的条件进行筛选,获得更为满足用户需求的结果.显然,二次检索在黄页搜索中的应用是必要的.基于这样的需求,提出了一种使用内存数据库和黄页搜索引擎联合进行二次搜索的方法.  相似文献   

9.
定向查询引擎在Web化学数据库集成检索中的应用   总被引:7,自引:7,他引:0  
Internet上的化学数据库是重要的专业资源,基于超链接分析的搜索引擎还不能索引这类资源。本论文以充分利用Internet上的化学数据库数据为目标,将“一个查询发动多个同级检索引擎,并以结构化的方式组织信息”的方案应用于以化合物标识信息为检索入口的Web化学数据库,建立了一个基于多站点集成检索的Web数据库定向查询引擎。该引擎是一个包括用户交互层、中间检索层、数据提供层的三层Web模型。各层在系统内部分别对应于响应用户检索请求的客户端代理模块、集成远程Web信息的服务器端代理模块,以及提供缓存和检索的关系数据库模块。模型采用JSP+Java组件的开发方式,在HTTP协议标准发送方法的基础上,采用XML技术对检索返回文档进行结构化数据的提取和表示,利用XML—DBMS实现XML数据的存储和检索,建立了一套针对深层Web数据交换的解决方案。依此方案所建立的ChemDB Portal Search实现了四个分布式Web化学数据库的有效加入、同时检索和统一显示。该系统是针对深层Web信息的挖掘和集成检索的一次尝试,它可为其它领域建立类似的系统提供借鉴。  相似文献   

10.
彭朝晖  崔立真  王珊  张俊  王长亮 《软件学报》2009,20(Z1):286-297
在关系数据库关键词检索(KSORD)中,用户的检索往往不能一次成功,有时需要多次重构查询(找到一组新关键词)来进行检索,但是查询的重构往往要花费用户大量的时间和精力.针对KSORD的结果,提出了一种相关反馈方法来自动重构查询.该方法选用基于向量空间模型的打分机制对KSORD结果打分,根据用户反馈或伪反馈的结果信息,采用基于概率的方法计算扩展用的语词,以查询扩展的方法自动重构查询进行再次检索.实验结果表明,这种方法能够为用户提供更多的相关结果.  相似文献   

11.
刘群 《计算机科学》2004,31(Z2):185-186
1引言 随着Internet所提供的信息和服务资源的快速增长,许多强有力的搜索引擎通过基于内容、关键词等方式对Web文挡进行搜索,但是不幸的是所查询的结果并不能使用户满意.聚类分析可以在数据集合特征未知的情况下,使用一种无示教的学习过程,对数据集合分布和聚合特性进行初步了解,但是聚类模型选择的好坏以及聚类结果的准确性都将影响到整个知识发现的质量.  相似文献   

12.
冗长查询指用户提交的句子成份复杂的查询。当前的搜索引擎对于关键字的检索取得了较好的结果。但是对于冗长的查询,如果将所有词作为关键字进行检索,往往只能返回相当有限的结果。我们尝试利用关键词之间的词语关联度,发现语义蕴含,删除“信息量”小的关键词,提高检索的效果。对于实验结果,我们分别从“面向机器”和“面向用户”两个角度进行评价。在“面向机器”的评价部分,我们根据搜索引擎返回结果的标红率和结果数进行自动评价;在“面向用户”的评价部分,我们对搜索结果文档进行人工评价。实验结果表明,我们的方法能够明显提高检索结果的数量和质量。  相似文献   

13.
因特网的飞速发展,网络资源呈爆炸式的增长。信息检索是人们上网的主要目的之一。目前的信息检索领域有许多检索方法与检索工具,为用户检索信息提供了许多途径。但如何利用搜索引擎实现更快更精确的搜索已经成为这一领域的研究热点。在研究现有的几种搜索引擎的基础上,提出了一种基于用户行为聚类的搜索引擎。通过分析不同的用户行为将搜索用户聚类成不同的用户组,为每组用户返回其喜欢的结果,优化查询结果。  相似文献   

14.
介绍了一个智能的互联网信息采集工具,它支持用户用自然语言查询,用知网抽取出查询语句中的关键词,进行自动分类,并自动去元搜索引擎上检索,生成网页搜索结果。该系统在准确率保持和手工获取相差不多的情况下,大大缩短了获取信息的时间,节省了人力。  相似文献   

15.
互联网怎么用?网上的资料去哪里找?初上网者都很迷惑,其实用一个搜索引擎就能轻松找到你要的一切资料。下面,就让我们一步一步学习搜索的原理和技巧。●搜索引擎分类搜索引擎按其工作方式主要可分为两种:1.全文搜索引擎:最具代表性的有Google和百度。它们从互联网上提取各个网站的信息(以网页文字为主)来建立搜索数据库,然后从数据库里检索与用户查询条件匹配的相关记录,并按一定的排列顺序将结果返回给用户。2.目录索引类搜索引擎:这种引擎是按目录分类的网站链接列表。最具代表性的有新浪、雅虎、搜狐、网易等,各网站的具体网址如下:Goog…  相似文献   

16.
网络搜索引擎的性能优化策略和相关技术   总被引:5,自引:0,他引:5  
由于检索结果的不准确性,使网络搜索引擎有时难以满足用户的查询需求。因此,在传统搜索引擎技术的基础上,采用其它理论和技术来提高搜索引擎的查准率,可以对搜索引擎进行性能优化。该文提出了几种对网络搜索引擎进行性能优化的策略,并对相关的实现技术进行了探讨。根据网络资源的权威性及其与用户查询的相关性对检索结果进行排序,可以有效提高结果的准确度;通过基于概念的信息检索技术和信息的自动分类技术可以有效地对用户查询进行语义的扩充和理解,更好地满足用户需求;实现搜索引擎的个性化查询和专业化查询,也是提高搜索引擎性能的重要途径。  相似文献   

17.
一种在Internet国际互联网上,克服信息流通瓶颈,建立一种基于用户双向反馈功能的检索模式,并举例介绍了借助于Reference.COM的检索引擎,通过Internet新闻组,灵活进行自动查询信息的搜索引擎主动式信息服务方法。  相似文献   

18.
卫琳 《微机发展》2007,17(9):65-67
搜索引擎返回的信息太多且不能根据用户的兴趣提供检索结果,使得用户使用搜索引擎难以用简便的方式找到感兴趣的文档。个性化推荐是一种旨在减轻用户在信息检索方面负担的有效方法。文中把内容过滤技术和文档聚类技术相结合,实现了一个基于搜索结果的个性化推荐系统,以聚类的方法自动组织搜索结果,主动推荐用户感兴趣的文档。通过建立用户概率兴趣模型,对搜索结果STC聚类的基础上进行内容过滤。实验表明,概率模型比矢量空间模型更好地表达了用户的兴趣和变化。  相似文献   

19.
一种基于聚类技术的个性化信息检索方法   总被引:7,自引:2,他引:5       下载免费PDF全文
实践证明聚类技术是改进搜索结果显示方式的一种有效手段。然而,目前的聚类方法没有考虑到用户兴趣,对于相同的查询,返回给所有用户同样的聚类结果。由此提出一种个性化聚类检索方法。该方法改进了k-means算法,利用该算法对传统搜索引擎返回的结果结合用户兴趣进行聚类,返回针对特定用户的网页簇。实验证明该方法能够提供个性化服务,改善了聚类的效果,提高了用户的检索效率。  相似文献   

20.
基于搜索结果的个性化推荐系统研究   总被引:1,自引:0,他引:1  
搜索引擎返回的信息太多且不能根据用户的兴趣提供检索结果,使得用户使用搜索引擎难以用简便的方式找到感兴趣的文档。个性化推荐是一种旨在减轻用户在信息检索方面负担的有效方法。文中把内容过滤技术和文档聚类技术相结合,实现了一个基于搜索结果的个性化推荐系统,以聚类的方法自动组织搜索结果,主动推荐用户感兴趣的文档。通过建立用户概率兴趣模型,对搜索结果跚℃聚类的基础上进行内容过滤。实验表明,概率模型比矢量空间模型更好地表达了用户的兴趣和变化。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号