首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 437 毫秒
1.
目前大多数的Peer-to-Peer(P2P)系统只支持基于文件标识的搜索,用户不能根据文件的内容进行搜索.Top-k查询被广泛地应用于搜索引擎中,获得了巨大的成功.可是,由于P2P系统是一个动态的、分散的系统,在P2P环境下进行top-k查询是具有挑战性的.提出了一种在集中式P2P系统中的基于中心文档的层次化的top-k查询算法.首先,采用层次化的方法实现分布式的top-k查询,将结果的合并和排序分散到P2P网络中的各个节点上,充分利用了网络中的资源.其次,将节点返回的结果录入到中心文档中,然后确定其分数上限,对节点进行选择,提高了查询效率.  相似文献   

2.
李继良 《福建电脑》2007,(4):116-117,93
对等网络(Peer-to-Peer)模型是一种新型的体系结构模型,许多优势有待于进一步发掘,拥有广阔的应用前景.提出了一种在P2P环境下共享数据库的新框架:基于关键词查询的数据库共享.将每个节点上的数据库看成是一个文档集,用户不用考虑数据库的模式结构信息,简化了不同节点数据库模式问的映射过程,能够较好地适应P2P分散和动态的特性.  相似文献   

3.
纯Peer to Peer环境下有效的Top-k查询   总被引:19,自引:2,他引:19       下载免费PDF全文
何盈捷  王珊  杜小勇 《软件学报》2005,16(4):540-552
目前大多数的Peer-to-Peer(P2P)系统只支持基于文件标识的搜索,用户不能根据文件的内容进行搜索.Top-k查询被广泛地应用于搜索引擎中,获得了巨大的成功.可是,由于P2P系统是一个动态的、分散的系统,在纯的P2P环境下进行top-k查询是具有挑战性的.提出了一种基于直方图的分层top-k查询算法.首先,采用层次化的方法实现分布式的top-k查询,将结果的合并和排序分散到P2P网络中的各个节点上,充分利用了网络中的资源.其次,根据节点返回的结果为节点构建直方图,利用直方图估计节点可能的分数上限,对节点进行选择,提高了查询效率.实验证明,top-k查询提高了查询效果,而直方图则提高了查询效率.  相似文献   

4.
P2P环境中不确定数据Top-k查询处理算法   总被引:1,自引:0,他引:1  
近年来随着P2P技术的日益发展,P2P环境中的Top-k查询处理技术也越来越成熟.但是,自从不确定数据在数据库的各个领域受到广泛重视,这就引发了学术界和工业界对研发新型的不确定性数据管理技术的兴趣.所以在P2P环境中对不确定数据进行Top-k查询处理就成为了一个新的挑战.主要研究P2P环境下的不确定数据Top-k查询处理技术.首先给出了在不确定数据集上的Top-k查询的定义;然后,以Chord拓扑为例阐述了在P2P环境中对不确定数据的Top-k查询处理算法,并且在保序散列的基础上提出了基于upper-bound的剪枝策略及其改进的路由剪枝策略;最后,通过大量的实验来验证了所提出算法的性能.  相似文献   

5.
基于信任的P2P真实性查询及副本管理算法s   总被引:2,自引:0,他引:2  
李治军  廖明宏 《软件学报》2006,17(4):939-948
文档安全性对于信息共享Peer-to-Peer(或P2P)系统而言是一项重要的性能指标,以P2P系统的文档安全性优化为目标.P2P系统的文档安全性主要取决于两方面的因素:其载体的安全性和文档相关机制的构造,如副本管理等.对于P2P这样高度自主的分布式系统而言,文档安全性的提高无法依赖于结点安全性的提高,而应依靠对文档相关机制的控制来实现.首先设计了一个对文档安全性敏感的查询协议,以该查询协议为基础,与文档相关的机制就可以形式化地表述为函数,而系统文档安全性的提高就转化为函数空间上的数学分析.基于函数分析的结果,设计了一套旨在提高文档真实性的副本管理算法集合.理论分析的结果表明:在理想情况下,该算法集合可达到文档真实性的优化.对于实际系统,经过大量的模拟实验结果验证,该算法集可以获得良好的效果,接近优化水平.  相似文献   

6.
首先从混合式P2P网络拓扑结构出发,结合DHT思想,提出了基于DHT的层次化P2P网络模型.其次根据在文档集巨大的情况下,用户提交的查询不可能"面面俱到",实际用来回答查询的文档仅仅是文档集中很小的一部分这一思想,在层次化P2P模型的超级节点中建立了分布式缓存,运用分布式索引与缓存技术,提出一种新的方法来解决多项查询问题.即由多项查询中的某个关键字key,根据hash函数定位到负责该key的超级节点,查询该节点上的分布式索引得到缓存具体存储位置,最终将结果返回给用户,如若缓存中没有所要查询的内容,则广播该查询,同时根据系统中的历史广播查询信息来计算某个待选缓存项的利益值,利益最大的待选项加入缓存.一般针对多项查询的泛洪算法往往会造成巨大的网络信息量,提出的方法牺牲了超级节点上一小部分的存储力,缓解了多项查询造成的网络拥挤现象.同时,基于DHT的层次化P2P模型也具有很好的稳定性,不会因为大量节点的动态加入或者退出而无法进行多项查询.  相似文献   

7.
一种高效的P2P环境中的窗口查询算法   总被引:1,自引:0,他引:1  
随着多媒体以及P2P网络的发展,针对高维数据基于属性的窗口查询已经成为一个重要研究课题.提出了一种在超级节点P2P网络中有效解决高维数据的窗口查询算法,在每个单独的网络节点上,数据通过一种降维算法映射到一维空间,在超级节点上,构造数据的统计信息表以及构造网络查询树,算法在每次查询时,按照查询树的规则来访问整个网络,并利用统计信息剪枝网络中的节点查询,避免网络的泛洪.实验中使用了不同的数据集来评测算法的查询效率,结果表明该算法具有很高的查询效率.  相似文献   

8.
基于非结构化P2P网络的应用日益广泛,参与共享资源的节点越来越多,且呈海量增长趋势.如何在海量节点、海量资源的情况下,对同一查询语义进行增量式查询,是一个重要而颇具挑战性的问题.提出了一个通用的近似依相关性大小的非结构化P2P网络增量式查询算法模型,该算法模型使得针对同一查询语义的增量式查询尽力优先访问与语义最为相关的节点,从而在完全分布式的P2P网络中获得类似Google[1]的依据资源相关性排序显示及其"下一页"的功能.  相似文献   

9.
结构化P2P上的高效多属性区间查询   总被引:1,自引:0,他引:1       下载免费PDF全文
海沫 《计算机工程》2010,36(6):58-60
在结构化P2P上的多属性区间查询中,查询算法所需的跳数和消息数依赖于节点个数和被查询的区间大小,属性值改变时会产生大量的消息。针对这些问题,提出结构化P2P上基于节点动态分组(PDG)的多属性区间查询机制。仿真结果表明,PDG中解析每个查询所需的跳数和消息数与被查询的区间大小和节点个数无关,更新属性值所产生的消息数减少,并且节点分组的维护开销较低。  相似文献   

10.
分布式Top-k查询计算在多媒体近似匹配、网络监控、文档检索和Web数据搜索等技术中具有重要意义.分析分布式Top-k查询计算算法性能的重要标准是网络延迟和带宽消耗.早期的算法主要研究在集中式的环境中,提供有效地处理分布式Top-k查询计算.然而,在动态的、分布式环境中,这些方法还显得不够成熟.因此,提出了一种在网络查询过程中建立的树形拓扑结构,利用直方图统计信息和Bloomfilter数据压缩技术,有效地执行局部优化,及在中间节点(peer)进行部分结果的合并,最终得到全局处理的Top-k查询计算方法(称做TTC算法).这种算法不仅降低了网络延迟,有效地支持动态变化的分布式环境,而且减少网络带宽的消耗.实验结果表明,TTC算法在全局带宽的消耗和网络的响应时间上效果非常显著.  相似文献   

11.
关系数据库上的关键字检索和不确定数据处理过去一直是两个独立的研究方向。研究了运用关键字方法检索不确定数据的问题,定义了不确定关键字查询的基本模型和语义,提出了一种在属性级粒度的不确定数据库上进行top-k关键字检索的算法。该算法根据用户指定的k值,计算并返回分数最高的前k个结果,其查询结果的评价函数综合考虑了结果与关键字的相关度和结果在可能世界语义下的概率大小。对算法进行了优化,显著降低了计算复杂度。最后通过实验,证明了算法的高效性和实用性。  相似文献   

12.
关系数据库上的关键词查询使得用户不必了解SQL语法或者数据库模式即可方便进行检索,并利用关系表的连接来保证查询的完整性。由于关键词集合查询的信息通常与不同数据类型的字段相关,并且分散在多个表中,而关系数据库缺乏对这类信息有效的索引,从而导致查询效率和准确率比较低。针对关系数据库的结构化模式,提出了一种基于层次树的数据提取方法,将关系数据库模型化为一棵层次树,关键词查询问题转化为树的遍历问题,并从关键词数据类型的分类、属性值之间的相关度、查询结果评分排序等方面设计了一个综合的优化方法。通过实验验证,该方法可以实现以较高的效率和较低的计算代价完成关键词查询。  相似文献   

13.
分析了P2P中节点资源分布特点。根据搜索条件,在资源匹配度的基础上提出了节点匹配度的概念。基于节点匹配度与资源的smallworld分布特征提出top-k资源的搜索、评价算法。该算法使搜索能够在整个网络内进行,并朝资源匹配高的范围传播。在提高搜索效率、节约网络带宽的同时,保证了最终获取的k个资源是最匹配的。根据搜索条件选择广播匹配节点的方法有效地平衡了搜索、评价的带宽和计算资源。  相似文献   

14.
分析了P2P中节点资源分布特点。根据搜索条件,在资源匹配度的基础上提出了节点匹配度的概念。基于节点匹配度与资源的small world分布特征提出top-k资源的搜索、评价算法。该算法使搜索能够在整个网络内进行,并朝资源匹配高的范围传播。在提高搜索效率、节约网络带宽的同时,保证了最终获取的k个资源是最匹配的。根据搜索条件选择广播匹配节点的方法有效地平衡了搜索、评价的带宽和计算资源。  相似文献   

15.
Keyword search in relational databases   总被引:1,自引:1,他引:0  
This paper surveys research on enabling keyword search in relational databases. We present fundamental characteristics and discuss research dimensions, including data representation, ranking, efficient processing, query representation, and result presentation. Various approaches for developing the search system are described and compared within a common framework. We discuss the evolution of new research strategies to resolve the issues associated with probabilistic models, efficient top-k query processing, and schema analysis in relational databases.  相似文献   

16.
在关系数据库中,关键词查询无需用户学习查询语言和数据库模式相关知识,而且有效地扩大了查询范围.采用元组图描述关系数据库中元组关系,可使关键词查询问题转化为元组图的最小Steiner树求解问题.本文提出元组图上基于相似度的边权重计算方法,使边权重能够反映元组与关键词相似度的大小.然后,鉴于最小Steiner树求解问题是NP-完全问题,提出按照贪心策略执行Dijkstra算法的最小Steiner树较优解求解算法.最后,通过实验对算法进行了分析和验证.  相似文献   

17.
关系数据库的关键词搜索面临的最大挑战在于满足需求的答案可能来自多个关系的元组的组合。现有主流方法通过定位每个关键词对应的元组并动态发现元组之间的关联来得到搜索结果。然而当数据库规模较大或模式复杂时,这些方法存在搜索效率低的问题;此外,这些方法因只能支持简单的关键词查询而实用性受到限制。为此,提出对元组的组合进行预先索引从而加快搜索,此外还对其索引效率及查询能力进行改进以提高系统的可用性。首先,为了提高搜索和索引效率,提出基于模式图的元组连接枚举技术,该技术利用无环模式图枚举合适的关系连接,将其转换为SQL语句在数据库中执行以得到可能的元组连接;其次,为了保证结果的紧致性,提出了1到m元组连接的预先索引与顺序搜索机制,该机制对元组连接进行由小到大的搜索,并限制所有包含已有结果的元组连接都不再参与搜索;最后,为了支持复杂查询,提出基于域的索引结构,为每个元组连接建立面向不同查询类型的域,通过查找多个域并对结果进行逻辑组合得到最终结果。实验表明,相比于已有技术,本技术具有较快的索引速度与较高的查询效率,并能提供如布尔查询、属性查询等的复杂查询能力。  相似文献   

18.
SEEKER:基于关键词的关系数据库信息检索   总被引:20,自引:3,他引:20  
文继军  王珊 《软件学报》2005,16(7):1270-1281
传统上,SQL是存取关系数据库中数据的主要界面.但是,对于没有经验的用户来说,学习复杂的SQL语法是一件困难的事情.实现基于关键词的关系数据库信息检索,将使用户不需要任何SQL语言和底层数据库模式的知识,用搜索引擎的方式来获取数据库中的相关数据.描述了一个基于关键词的关系数据库信息检索系统SEEKER的设计和实现.现有的关系数据库关键词查询系统只能检索关系数据库中的文本属性,而SEEKER还可以检索数据库元数据以及数字属性.并且,SEEKER采用了更合理的排序公式,支持Top-k查询.实验结果显示,SEEKER具有良好的查询性能.  相似文献   

19.
RDF查询语言到SQL语言的转换原理及其实现方法   总被引:2,自引:0,他引:2  
RDF查询语言的优点是具有语义性,缺点是对于海量信息的存储和查找的效率都很低.而关系数据库对海量信息的存储和查找的效率皆很高,但是其查询语言SQL却缺乏语义信息.为了使信息查询既有RDF的语义性又有关系数据库的高性能,提出将RDF查询语言到SQL语言的转换原理,并在此基础上实现一个对用户透明的、建立在关系数据库之上的RDF查询引擎.其优点是:可以利用关系数据库来存储和查询RDF信息,提高其海量存储和查找效率;对存储在不同的关系数据库中的关系数据,能够利用RDF的查找特性进行异质数据库之间的信息交换及信息融合.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号