首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对当前元搜索引擎存在的问题,提出一种个性化元搜索结果整合算法。首先对成员搜索引擎根据相应条件设定权值,对各成员搜索引擎得到的搜索结果按贡献量加权分块排序,根据用户检索词条与兴趣库和元搜索结果的文本相关度对块内搜索结果进行整合排序。实验结果表明,该算法能够满足不同用户的个性化需求,在保证了搜索结果查全率的同时提高了查准率,很大程度上改善了用户检索效果和效率。  相似文献   

2.
通过主题提取进行海洋信息词典的构建,利用已有的向量空间模型进行海洋信息相关度计算,设计了成员引擎的调度方法,并结合主题相关度和邻居协同推荐算法对结果综合排序,搭建了一个面向海洋信息的个性化元搜索引擎。减少了搜索结果的信息量,提高了信息搜索的准确率。  相似文献   

3.
李建廷 《计算机仿真》2010,27(7):138-140,161
元搜索引擎将检索要求提交给多个成员搜索引擎,并将搜索到的网页按照一定的优先关系排列并显示给用户.如何把各成员搜索引擎的结果有机的融合在一起,进一步提高元搜索引擎的查准率,对元搜索引擎来说具有重要的意义.模糊积分算法利用各个信息源提供的信息和权值来为决策过程提供必要的数据,这种类型的信息融合能够解决信息提取和处理过程中的不确定性.实验表明利用模糊积分思想进行结果排序的算法,从一定程度上能够把搜索引擎的结果有机的融合在一起,进一步提高元搜索引擎的查准率.  相似文献   

4.
当前存在的元搜索查询方法不够精确,为了解决这一问题,建立了主题元搜索模型,提出了一种基于主题信息与相关度相结合的结果整合算法。该算法综合考虑了主题信息与成员搜索引擎之间的相关度,主题信息与查询结果之间的相关度,查询词与查询结果的相关度,以及查询结果的重复度、位置等诸多因素。实验表明,该算法能够很好地把用户最关心的结果排在查询结果集的前面,提高了查准率。  相似文献   

5.
在传统的元搜索引擎中采用了Borda排序算法,即根据成员引擎检索结果的相关位置赋予一定分值,求和后按总分递减排序。这对各个成员引擎检索结果重叠度较高的检索排序非常有效,但对独立的搜索结果效果不好,速度较慢。另有根据检索字符串和检索结果的标题、摘要等相似度进行排序,这种排序快速,实现简单,但返回的信息简单,可能导致摘要信息多的排在前面,而不是内容相关的高的排在前面。针对这两种算法的不足,提出了一种改进的综合Borda排序算法,计算检索字符串和结果标题、摘要的相似度,再把相似度作为相关分值进行排序,它综合了两种算法。实验结果表明,他的查准率优于传统的Borda算法。  相似文献   

6.
元搜索引擎集合了多个成员搜索引擎的结果,将结果进行一定的处理后再将处理后的结果返回给用户。其中对结果的重新排序直接影响到元搜索引擎的性能。基于通信领域上的信息量与信息熵提出一种计算结果相关度的算法——信息关联度IRD算法,再将算法进行特定的修正,并提出一种合并算法CombMul,将以上算法应用到元搜索引擎中,最终用MRR查准率来评价此方法。得到的MRR查准率数据表明,与广泛应用的Borda排序算法相比,IRD算法结果更为理想。  相似文献   

7.
元搜索引擎是搜索之上的搜索,是将多个独立搜索引擎的结果进行融合,显示给用户,因此结果融合是元搜索引擎的重要部分.利用用户对不同独立搜索引擎的置信度及用户的兴趣信息对各个独立搜索引擎的结果进行个性化融合排序,使得用户最感兴趣的内容能有较高的排名,提高用户搜索的查准率,提高用户搜索的效率.对于同一搜索关键字各个用户可以得到自己个性化的搜索结果,提高用户的满意度.  相似文献   

8.
针对目前全文搜索引擎中存在的查准率较低、不能充分满足专业用户对搜索引擎的搜索需求的问题,设计一种基于元搜索技术的垂直搜索引擎系统结构。利用关联规则挖掘用户关注度较高的信息,提取这些信息中与关键词相关的隐形关键词,并用于扩展搜索。设计基于多关键词组搜索的改进的元搜索引擎位置排序算法。实验结果表明,与以前搜索引擎系统相比,该系统的专业相关度有了一定提高。  相似文献   

9.
为提高校园网搜索引擎的查准率,提出一种新的校园网搜索引擎排序方法。该方法基于用户查询主题、用户浏览时间和页面点击等用户行为特征,计算新的页面相关度得分,改进搜索引擎的排序结果,为用户提供更准确的查询服务。实验结果表明,在不降低查全率的情况下,应用该排序方法的查准率有明显提高。  相似文献   

10.
基于用户兴趣的元搜索结果合成算法研究   总被引:1,自引:0,他引:1  
元搜索引擎将为用户提供更全面的搜索结果信息,但在庞大的搜索结果中快速找到自己感兴趣的结果并非易事.针对查询结果合成问题,提出了一种基于用户兴趣的结果合成方法,在摘要法计算用户查询与查询结果相关度的基础上引入了词条等级和用户兴趣,实现了元搜索引擎的个性化.通过程序实现此算法,分别与单个搜索引擎以及其他几种结果合成算法比较,证明此算法保证了搜索结果的查全率,又提高了查准率,大大改善了用户检索效果和效率.  相似文献   

11.
孔德镛  张建军 《计算机工程》2010,36(19):203-204,207
针对元搜索引擎的查准率等问题,分析专业元搜索引擎返回结果的专业相关度问题,提出一种基于遗传算法的网页排序算法,讨论算法的原理及实现过程。在独立搜索引擎返回结果中,挖掘除位置信息以外的其他信息,利用遗传算法建立专业网页相关度模型,对网页的专业相关度进行计算。实验结果表明该算法效果较好。  相似文献   

12.
元搜索引擎的核心技术是排序算法.在研究元搜索引擎排序算法的基础上,通过合理简化等一系列措施建立数学模型,抽象出元搜索引擎排序算法的基本框架.随后结合各成员搜索引擎的市场份额及各成员搜索引擎的搜索结果,给出了一种新的元搜素引擎排序算法.该算法简单且易于实现.  相似文献   

13.
基于Agent的智能元搜索引擎技术研究   总被引:2,自引:0,他引:2  
针对现有搜索引擎存在的问题,提出基于Multi-agent的分布式搜索引擎系统.系统采用元搜索引擎结构,利用Agent技术和基于个性化模式的信息过滤技术,使系统具有一定的智能性.通过个性化检索和分类浏览相结合的检索方式可提高搜索结果的可浏览性.结合数据库的分类和虚拟语言模型方法实现了资源选择的优化.提出基于文本/位置分析和群决策的合并算法,对搜索结果的标题和文档片断信息进行相关度分析,将文本分析与规范化的搜索结果位置信息相结合,计算文档的相关分值,最后采用基于群决策的合成方法对搜索结果进行一致性排序.试验结果表明,提出的元搜索系统具有较好的搜索效果.  相似文献   

14.
基于Nutch 的垂直搜索引擎系统   总被引:1,自引:1,他引:0  
李耀芳  张涛 《计算机系统应用》2011,20(9):193-196,47
由于通用搜索引擎搜索精度不高,而国内各大物流港口搜索有效性较低,设计基于Nutch的港口物流垂直搜索引擎系统,实现了各个港口物流信息的快捷查询和共享。系统采用了基于向量空间模型的主题相关度判别算法并对该算法进行改进,加入元数据判别机制和重要标签所包含关键词的加权处理。加入“隧道处理”机制,以处理主题网页分离的问题,并且修改了检索结果排序的源代码,使其更适应垂直搜索引擎的要求。  相似文献   

15.
刘登洪  徐贤 《计算机科学》2017,44(10):234-236, 258
随着网络的普及,网上检索成为了人们获取信息的主要方式。目前的搜索引擎相对独立,覆盖范围比较有限。相比之下,元搜索能够更好地满足用户的检索需求。当用户在元搜索提供的统一界面中输入一个查询时,元搜索会将处理后的用户请求发送给相关的成员搜索引擎。但是一个重要的问题是如何识别出潜在的搜索引擎以便更好地处理用户的请求。鉴于此提出了一种基于遗传算法的选择机制,该方法将各个成员搜索引擎的权重考虑在内。实验结果表明,该方法确实能够提高引擎选择中的效率和精度。  相似文献   

16.
为了在大量网络Web页面中快速找到用户关心的内容,提出使用词汇之间的"相关度"来存储用户的个性化信息,应用能够在用户进行检索的过程中自动建立针对该用户的"词汇相关度"的算法设计了一个个性化元搜索引擎,并通过使用3种不同的利用词汇相关度对底层搜索引擎所返回的结果进行评估和个性化排序的算法进行实验.这里设计的个性化算法的灵敏度、抗干扰性、语义相关性分析3个指标的实验结果说明该算法最终会影响到网页的排序.基于统计方法的词汇相关度模型是一种有效的个性化信息检索技术,它可以大大提高搜索结果的质量.  相似文献   

17.
个性化元搜索引擎模型研究   总被引:3,自引:1,他引:2       下载免费PDF全文
在分析了传统搜索引擎以及现有元搜索引擎不足之后,提出了基于Agent的个性化元搜索引擎模型,与传统的元搜索引擎系统相比改进了系统的运行效率,同时给出了基于用户反馈的个性化QR-加权重排序算法,将检索结果的排序质量以及文档的相关度在重排序中加以考虑,与传统的线性重排序算法相比提高了查询的准确程度。  相似文献   

18.
针对单个网站构建本体库垂直搜索引擎的过程中,叙词及其间逻辑关系等收集整理所耗人力成本高,导致该技术框架虽成熟,而大多网站搜索功能仍以字符匹配为主,缺乏分词、查询扩展及结果的相关度排序,很难准确命中相关查询内容等问题,设计并开发了一套基于网站简约本体库的垂直搜索系统。该系统以中国气象数据网(http://data.cma.cn)为例,利用protégé根据网站的导航目录,构建了中国气象数据网的本体库,基于Lucene引擎构建技术框架,对本体库中的对象及网页内容分别进行分词,并构建本体对象索引库及网页索引库;前端对查询内容分词后,先在本体对象索引库中进行扩展,利用TF-IDF相关度算法计算扩展结果的相关度并排序,该值作为各扩展本体对象的权值,并将各自的权值动态赋给利用Jena二次语义分析技术扩展的对象,最后将所有带有权值的关键词在网页索引库中查询检索,计算结果相关度并排序。实验结果表明,该系统构建简便,能为用户扩展、推荐相关查询内容,提高了针对网站检索的查准率及查全率。  相似文献   

19.
用户在使用传统的搜索引擎去检索某一主题的相关信息时,需要从几个不同的方面搜索许多站点,组织和整合这些不同站点的信息变得非常重要。为实现跨媒体搜索,文中提出了一种基于Agent的查询分解策略,并将检索结果予以整合。将查询条件分解,能弥补传统图片搜索引擎在多关键词检索方面的不足,提高信息的传播效率。文中给出了例子予以验证。实验证明,查询分解策略能够有效地改善查全率,查准率也能够保持在70%左右。  相似文献   

20.
Internet上专题资源网页汇聚和检索是垂直搜索引擎中的核心问题,HITS算法是早期解决这个问题的经典算法,很多文献对它进行了改进,但无论索引的主题相关率还是引擎的查准率都有提高的余地。提出一种基于锚文本和标题信息过滤并结合网页内容相关度判断的HITS专题检索策略,利用专题训练集判断主题相关度,很好地解决了只依靠查询字符串判断的弊端。实验表明,此策略能很好地提高专题信息汇聚精确度和检索的准确率,并且减少了非相关URL的下载量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号