首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 656 毫秒
1.
文中给出了一种基于Chord覆盖网络索引结构的多属性查询处理技术.利用卡诺图计算查询结果所在的节点,并以多播树的方式将查询请求发送到对应的节点上,从而实现了相邻数据之间的快速路由.实验证明了该方法在处理多属性查询时的有效性和高效性.  相似文献   

2.
属性图各节点附有的节点属性标签,为节点提供了更加丰富的信息,在数据挖掘应用,特别是数据聚类问题中如何有效利用这些丰富的信息,已经成为开展此类研究的研究目的。不同于传统图聚类,属性图上的聚类要同时考虑图的结构信息和节点的属性信息,因此如何平衡两者之间的关系,这是属性图聚类主要关注所在。目前已提出的属性图聚类算法,部分算法的效率很高,然而聚类质量较差,同时一些算法可以得到较好的聚类结构,然而算法消耗大量的系统资源,效率也较低。这些算法均没有考虑簇之间存在重叠的情况,这导致无法得到更高精度的聚类结构。因而提出一种属性图上的重叠聚类挖掘算法,实验表明,提出的算法可以得到更高的聚类精度,特别是可以提升聚类内部节点的属性相似度。  相似文献   

3.
基于语义度量的RDF图近似查询   总被引:1,自引:0,他引:1       下载免费PDF全文
  相似文献   

4.
基于特征子图的异构信息网络节点相似性度量   总被引:1,自引:0,他引:1  
为解决异构信息网络相似性度量的问题,提出了基于节点特征子图的节点相似性度量算法,通过节点特征子图的最大公共子图与最小公共超图之间的差异性,进行节点间的相似性度量.该算法以图理论为基础,根据连边的不同类型设定不同权值,在考虑节点信息相似的同时,加入节点在网络中的结构信息,最大程度地利用了异构信息网络所富含的信息.实验结果表明,提出的算法具有较好的性能和有效性.  相似文献   

5.
李先通  安实 《电子学报》2010,38(12):2937-2943
 交通网络可利用图数据进行描述与分析,常用的方法包括挖掘、查询、分类等.提高大规模图集上查询算法效率的问题是当前图数据分析领域中一个重要的研究方向.给定图集,图包含查询返回图集中所有查询图的子图.本文提出一种基于频繁闭图的包含查询算法.算法首先通过选择比消除频繁闭图之间的冗余,然后将具有强选择性的频繁闭图通过树的结构组织起来建立索引,并在此索引基础上实现图包含查询.在文章的最后,给出了理论与实验的分析结果.结果表明,该算法不但能高效的进行索引筛选,而且能显著的减小候选集尺寸,进而大大的降低了查询图与索引模式之间以及与候选集之间的子图同构测试次数,提高了查询效率.  相似文献   

6.
针对传统图模式查询算法难以实现在大图数据上查询或查询时间太长问题,提出基于MapReduce的图查询并行算法PGPQ。该方法包括计算初始匹配节点集、初始不匹配父亲节点集和图模式查询三个部分。在图模式查询过程利用初始不匹配父亲节点集迭代初始匹配节点集中的节点,如果数据图匹配模式图,返回一个最大的匹配。实验结果表明,PGPQ算法查询能有效地进行大图模式查询。  相似文献   

7.
针对数字图书馆用户隐私保护问题,提出了一种基于图聚类匿名发布的敏感数据保护方法。该方法将数字图书馆用户数据建模为属性图,利用结构相似性和属性相似性对属性图中节点进行聚类,并将类簇中的节点信息进行匿名化处理,实现了用户数据的匿名化保护。实验结果表明,该方法在实现用户数据匿名保护的同时,有效减少了信息损失,提高了计算效率。  相似文献   

8.
李青青  马慧芳  李举  李志欣 《电子学报》2021,49(11):2096-2100
社区搜索旨在寻找与给定查询节点高度相关的个性化社区.现有社区搜索方法多面向简单网络且处理单个查询节点或假定多个查询节点来自同一社区,这种严格的假设使得算法灵活性受限.据此,提出一种在属性网络中利用查询节点随机游走路径的相似性增强的多社区搜索方法,可以有效地定位查询节点所属的多个局部目标社区.具体地,有效融合网络中高阶结构与属性信息,利用重启随机游走计算各查询节点的重要性分数向量;计算查询节点随机游走路径的相似性并设计一种相似性增强策略,使得在无监督学习中相似路径游走者彼此增强关联从而定位不同查询节点所属的多个社区结构;基于结合结构和属性的并行电导值精准查询社区.真实数据集和人工数据集的实验验证了本文方法的有效性和效率.  相似文献   

9.
基于改进哈夫曼编码的大规模动态图可达查询方法   总被引:1,自引:0,他引:1       下载免费PDF全文
随着社交网络分析、生物信息网络分析等新兴应用的涌现和计算机技术的飞速发展,图的规模迅速增长,并且频繁更新,使得对大规模动态图数据的处理需求愈加迫切.现有的面向大规模动态图的可达查询研究成果较少,尚存在索引压缩困难以及图结构待优化等问题.本文提出了一种支持大规模动态图的基于改进哈夫曼编码的可达查询处理方法(Huffman-based Label Reachability,HuffLR).该方法首先对预处理图进行结构上的两次压缩,得到双压缩图;其次,基于双压缩图提出一种前缀label索引,该索引能够有效表达节点间的可达关系;最后,提出双压缩图的演进和可达查询处理及优化算法,主要包括边的插入与删除、节点的插入与删除.实验表明,本文提出的基于改进哈夫曼编码的大规模动态图可达查询处理方法具有良好的可行性和有效性.  相似文献   

10.
肖冰  李洁  高新波 《电子学报》2009,37(10):2205-2210
 由于在图编辑距离(GED)的计算中合理地为编辑操作定义代价函数相当困难,因此本文提出一种基于图结构的独立于代价函数定义的GED计算方法.它利用边缘方向直方图刻画图的结构,通过计算边缘方向直方图之间的距离来判断图的相异性,从而无需再定义代价函数.Earth Mover’s Distance(EMD)可以准确地计算直方图之间的距离,而且对于图在平面内的旋转所引起的直方图变化具有鲁棒性.为此,本文采用边缘方向直方图之间的EMD计算图编辑距离.将图像用图来表示,利用这种新的图编辑距离度量图像之间的相似性.实验结果表明本文提出的方法可以简单而有效地对图像进行聚类和分类,与基于谱序列计算图编辑距离的方法相比,可以更好地刻画图的结构差异.  相似文献   

11.
给定一个有向图,一个k步可达查询u→?kv用来回答在该图中是否存在一条从顶点u到顶点v且长度不大于k的有向路径。k步可达查询是一种基本的图操作并在过去十年间被广泛地研究。已有的k步可达查询算法仍存在许多弊端,例如不可达查询效率低,索引规模大和索引构建时间长等。本文针对上述问题提出了2种优化方法,分别是基于互逆拓扑序号以及基于等价顶点的图压缩方法.前者提高了不可达查询的效率,后者减少了索引规模和索引构建时间。实验结果表明,本文提出的方法可以有效地处理k步可达查询,并支持大规模数据的处理。  相似文献   

12.
最短路径查询是图数据管理与复杂关系挖掘的基本操作之一.本文针对资源描述框架图上的top-k最短路径查询,构造基于组件的索引,并在该索引的基础上实现查询的响应.查询优化阶段,针对查询效率问题,提出频繁路径以及结构剪枝策略,并给出有效性证明.实验表明,本文方法准确返回top-k最短路径并提高92%的查询速率.索引构造时间相比已有方法,提高约56%.同时,索引所占空间仅为原始数据大小的1~1.2倍.  相似文献   

13.
In this paper, we approach the design of ID caching technology (IDCT) for graph databases, with the purpose of accelerating the queries on graph database data and avoiding redundant graph database query operations which will consume great computer resources. Traditional graph database caching technology (GDCT) needs a large memory to store data and has the problems of serious data consistency and low cache utilization. To address these issues, in the paper we propose a new technology which focuses on ID allocation mechanism and high-speed queries of ID on graph databases. Specifically, ID of the query result is cached in memory and data consistency is achieved through the real-time synchronization and cache memory adaptation. In addition, we set up complex queries and simple queries to satisfy all query requirements and design a mechanism of cache replacement based on query action time, query times, and memory capacity, thus improving the performance furthermore. Extensive experiments show the superiority of our techniques compared with the traditional query approach of graph databases.  相似文献   

14.
资源描述框架图查询中,准确估计查询结果的大小是查询优化器中的关键步骤.已有方法忽略了该图自身的不确定性以及子查询间的关联关系,无法有效估计结果.针对该问题,本文提出一种基于贝叶斯模型的基数估计方法.该方法引入贝叶斯网络模型,挖掘出子查询内的属性依赖.同时,在这些属性依赖的基础上提出子网拼接方法,计算出子查询间的影响因子.最后,利用以上信息准确估计出任意查询结果集的基数.实验表明:与已有方法相比,本文方法的准确性提高15%以上,性能没有大幅度下降.  相似文献   

15.
The demand for the analysis and application of graph data in various fields is increasing day by day.The management of large-scale graph data with complicated structure and high degree of coupling faces two challenges:one is querying speed too slow,the other is space consumption too large.Facing the problems of long query time and large space occupation in graph data management,a two-level index compression algorithm named GComIdx for graph data was proposed.GComIdx algorithm used the ordered Key-Value structure to store the associated nodes and edges as closely as possible,and constructed two-level index and hash node index for efficient attribute query and neighbor query.Furthermore,GComIdx algorithm used a graph data compressed technology to compress the graph data before it directly stored in hard disk,which could effectively reduce the storing space consumption.The experimental results show that GComIdx algorithm can effectively reduce the initialization time of the graph data calculation and the disk space occupancy of the graph data storing,meanwhile,the query time is less than common graph databases and other Key-Value storage solutions.  相似文献   

16.
Network function virtualization (NFV) allows to model network services as graphs interconnecting virtual network functions (VNFs), which may include nested VNFs, modeled as subgraphs of VNFs or end points. To query the performance data of network services modeled as abstract and high‐level graphs is challenging because of the recursivity of the NFV architecture and the elasticity and dynamicity provided by the NFV infrastructure. We propose to use Datalog, a declarative logic programming language, to build a framework that supports efficient data aggregation for performance metrics of recursively modeled network services. We present our recursive query language for automatic and flexible decomposition and aggregation of NFV performance metrics and describe example use cases for both compute and network metrics. We also describe the design and implementation of a proof‐of‐concept query engine using the language. Our performance evaluation shows that the total query latency is dominated by retrieval times of performance metrics from infrastructure databases, and the time for execution and automatic decomposition of high‐level queries by the query engine itself increases linearly with the size of the service graph up to 1000 nodes. Hence, our evaluations show that the query engine scales well, bounded mainly by the limited execution capabilities of our test environment. Furthermore, it can handle multiple concurrent queries up to the concurrency limits of the backend database in use. The proposed query language and engine are thus effective in recursively retrieving performance metrics of NFV environments supporting large‐scale service graphs and large numbers of query requests.  相似文献   

17.
梁俊斌  马行坡  奎晓燕 《电子学报》2014,42(10):2075-2080
在两层传感器网络中,查询驱动模式是将查询请求在下层传感器网络层进行分布式处理的一种查询处理模式.在传感器节点产生数据的频率较高而用户发出查询请求的频率较低的情况下,查询驱动模式能够大大减少数据传输量,降低节点的能量消耗.在这种模式下,如何有效支持局部区域性Top-k查询是一个很有挑战性的问题.针对这一问题,本文首先构造了一种新的数据汇聚树(DAT),接着在DAT的基础上提出了一种支持区域性Top-k查询的数据汇聚方案.理论分析和仿真实验表明,与已有算法相比,本文提出的方案更加高效.  相似文献   

18.
针对数据源新产生数据记录的增量爬取问题,提出了一种deep Web新数据发现策略,该策略采用一种新的属性值序列图模型表示deep Web数据源,将新数据发现问题转化为属性值序列图的遍历问题,该模型仅与数据相关,与现有查询关联图模型相比,具有更强的适应性和确定性,可适用于仅仅包含简单查询接口的deep Web数据源。在此模型的基础上,发现增长节点并预测其新数据发现能力;利用互信息计算节点之间的依赖关系,查询选择时尽可能地降低查询依赖带来的负面影响。该策略提高了新数据爬取的效率,实验结果表明,在相同资源约束前提下,该策略能使本地数据和远程数据保持最大化同步。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号