共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
通过主题提取进行海洋信息词典的构建,利用已有的向量空间模型进行海洋信息相关度计算,设计了成员引擎的调度方法,并结合主题相关度和邻居协同推荐算法对结果综合排序,搭建了一个面向海洋信息的个性化元搜索引擎。减少了搜索结果的信息量,提高了信息搜索的准确率。 相似文献
3.
元搜索引擎将检索要求提交给多个成员搜索引擎,并将搜索到的网页按照一定的优先关系排列并显示给用户.如何把各成员搜索引擎的结果有机的融合在一起,进一步提高元搜索引擎的查准率,对元搜索引擎来说具有重要的意义.模糊积分算法利用各个信息源提供的信息和权值来为决策过程提供必要的数据,这种类型的信息融合能够解决信息提取和处理过程中的不确定性.实验表明利用模糊积分思想进行结果排序的算法,从一定程度上能够把搜索引擎的结果有机的融合在一起,进一步提高元搜索引擎的查准率. 相似文献
4.
当前存在的元搜索查询方法不够精确,为了解决这一问题,建立了主题元搜索模型,提出了一种基于主题信息与相关度相结合的结果整合算法。该算法综合考虑了主题信息与成员搜索引擎之间的相关度,主题信息与查询结果之间的相关度,查询词与查询结果的相关度,以及查询结果的重复度、位置等诸多因素。实验表明,该算法能够很好地把用户最关心的结果排在查询结果集的前面,提高了查准率。 相似文献
5.
在传统的元搜索引擎中采用了Borda排序算法,即根据成员引擎检索结果的相关位置赋予一定分值,求和后按总分递减排序。这对各个成员引擎检索结果重叠度较高的检索排序非常有效,但对独立的搜索结果效果不好,速度较慢。另有根据检索字符串和检索结果的标题、摘要等相似度进行排序,这种排序快速,实现简单,但返回的信息简单,可能导致摘要信息多的排在前面,而不是内容相关的高的排在前面。针对这两种算法的不足,提出了一种改进的综合Borda排序算法,计算检索字符串和结果标题、摘要的相似度,再把相似度作为相关分值进行排序,它综合了两种算法。实验结果表明,他的查准率优于传统的Borda算法。 相似文献
6.
7.
8.
9.
10.
基于用户兴趣的元搜索结果合成算法研究 总被引:1,自引:0,他引:1
元搜索引擎将为用户提供更全面的搜索结果信息,但在庞大的搜索结果中快速找到自己感兴趣的结果并非易事.针对查询结果合成问题,提出了一种基于用户兴趣的结果合成方法,在摘要法计算用户查询与查询结果相关度的基础上引入了词条等级和用户兴趣,实现了元搜索引擎的个性化.通过程序实现此算法,分别与单个搜索引擎以及其他几种结果合成算法比较,证明此算法保证了搜索结果的查全率,又提高了查准率,大大改善了用户检索效果和效率. 相似文献
11.
12.
13.
基于Agent的智能元搜索引擎技术研究 总被引:2,自引:0,他引:2
针对现有搜索引擎存在的问题,提出基于Multi-agent的分布式搜索引擎系统.系统采用元搜索引擎结构,利用Agent技术和基于个性化模式的信息过滤技术,使系统具有一定的智能性.通过个性化检索和分类浏览相结合的检索方式可提高搜索结果的可浏览性.结合数据库的分类和虚拟语言模型方法实现了资源选择的优化.提出基于文本/位置分析和群决策的合并算法,对搜索结果的标题和文档片断信息进行相关度分析,将文本分析与规范化的搜索结果位置信息相结合,计算文档的相关分值,最后采用基于群决策的合成方法对搜索结果进行一致性排序.试验结果表明,提出的元搜索系统具有较好的搜索效果. 相似文献
14.
基于Nutch 的垂直搜索引擎系统 总被引:1,自引:1,他引:0
由于通用搜索引擎搜索精度不高,而国内各大物流港口搜索有效性较低,设计基于Nutch的港口物流垂直搜索引擎系统,实现了各个港口物流信息的快捷查询和共享。系统采用了基于向量空间模型的主题相关度判别算法并对该算法进行改进,加入元数据判别机制和重要标签所包含关键词的加权处理。加入“隧道处理”机制,以处理主题网页分离的问题,并且修改了检索结果排序的源代码,使其更适应垂直搜索引擎的要求。 相似文献
15.
随着网络的普及,网上检索成为了人们获取信息的主要方式。目前的搜索引擎相对独立,覆盖范围比较有限。相比之下,元搜索能够更好地满足用户的检索需求。当用户在元搜索提供的统一界面中输入一个查询时,元搜索会将处理后的用户请求发送给相关的成员搜索引擎。但是一个重要的问题是如何识别出潜在的搜索引擎以便更好地处理用户的请求。鉴于此提出了一种基于遗传算法的选择机制,该方法将各个成员搜索引擎的权重考虑在内。实验结果表明,该方法确实能够提高引擎选择中的效率和精度。 相似文献
16.
为了在大量网络Web页面中快速找到用户关心的内容,提出使用词汇之间的"相关度"来存储用户的个性化信息,应用能够在用户进行检索的过程中自动建立针对该用户的"词汇相关度"的算法设计了一个个性化元搜索引擎,并通过使用3种不同的利用词汇相关度对底层搜索引擎所返回的结果进行评估和个性化排序的算法进行实验.这里设计的个性化算法的灵敏度、抗干扰性、语义相关性分析3个指标的实验结果说明该算法最终会影响到网页的排序.基于统计方法的词汇相关度模型是一种有效的个性化信息检索技术,它可以大大提高搜索结果的质量. 相似文献
17.
在分析了传统搜索引擎以及现有元搜索引擎不足之后,提出了基于Agent的个性化元搜索引擎模型,与传统的元搜索引擎系统相比改进了系统的运行效率,同时给出了基于用户反馈的个性化QR-加权重排序算法,将检索结果的排序质量以及文档的相关度在重排序中加以考虑,与传统的线性重排序算法相比提高了查询的准确程度。 相似文献
18.
针对单个网站构建本体库垂直搜索引擎的过程中,叙词及其间逻辑关系等收集整理所耗人力成本高,导致该技术框架虽成熟,而大多网站搜索功能仍以字符匹配为主,缺乏分词、查询扩展及结果的相关度排序,很难准确命中相关查询内容等问题,设计并开发了一套基于网站简约本体库的垂直搜索系统。该系统以中国气象数据网(http://data.cma.cn)为例,利用protégé根据网站的导航目录,构建了中国气象数据网的本体库,基于Lucene引擎构建技术框架,对本体库中的对象及网页内容分别进行分词,并构建本体对象索引库及网页索引库;前端对查询内容分词后,先在本体对象索引库中进行扩展,利用TF-IDF相关度算法计算扩展结果的相关度并排序,该值作为各扩展本体对象的权值,并将各自的权值动态赋给利用Jena二次语义分析技术扩展的对象,最后将所有带有权值的关键词在网页索引库中查询检索,计算结果相关度并排序。实验结果表明,该系统构建简便,能为用户扩展、推荐相关查询内容,提高了针对网站检索的查准率及查全率。 相似文献
19.
用户在使用传统的搜索引擎去检索某一主题的相关信息时,需要从几个不同的方面搜索许多站点,组织和整合这些不同站点的信息变得非常重要。为实现跨媒体搜索,文中提出了一种基于Agent的查询分解策略,并将检索结果予以整合。将查询条件分解,能弥补传统图片搜索引擎在多关键词检索方面的不足,提高信息的传播效率。文中给出了例子予以验证。实验证明,查询分解策略能够有效地改善查全率,查准率也能够保持在70%左右。 相似文献