首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
ERSearch:一种高效的子图查询算法   总被引:1,自引:0,他引:1       下载免费PDF全文
子图查询是图数据库研究中的一个重要问题,许多方法基于“过滤-验证”策略进行子图查询,算法研究的重点为快速找到有效的特征集.通过对特征模式在数据图集中的嵌入信息进行分析,离线建立基于重叠关系、邻接关系和近邻关系的嵌入关系索引,提出基于嵌入关系的子图查询算法ERSearch.在给定查询图后,利用特征共现关系与特征嵌入关系联合进行过滤操作,并将过滤阶段的嵌入关系比对结果用于验证过程,提高验证效率.在真实及模拟数据上的实验表明,通过与PathIndex等方法的对比,ERSearch算法有效缩减了候选集的规模,能有效提高过滤与验证阶段的执行效率.  相似文献   

2.
随着图模型规模的扩大,单机算法难以适应大规模数据集下的子图查询.而现有的分布式算法基于无索引的简单遍历,join过程容易出现内存溢出,而且查询图分布异常时易出现负载不均衡.提出了一种基于谱编码的二叉索引树(SCBT-index),首先对数据图中的顶点谱编码,根据编码信息构建二叉索引树.然后对查询图使用最小查询计划进行分解,最后join过程使用3个剪枝策略:基于拓扑结构的预剪枝、序列化join和基于分布式下的join优化.实验结果表明,SCBT-index在图集下的综合性能优于现有主流算法,单图下的查询时间为现有算法的1/2到1/4.  相似文献   

3.
提出一种基于极大完全子图的最大频繁项集并行挖掘算法PMFIM,通过遍历由频繁2-项集构成的用邻-接矩阵表示的图,寻找图的极大完全子图,从而由极大完全子图顶点序列实现对项集的划分,即挖掘子任务的划分.在同类算法中,将找到的最大频繁项划分为局部最大频繁项集LMFI、可能最大频繁项集PMFI和邻接项集的最大频繁项集的超集SMFI,减少了该类算法合并最大频繁项集的开销,并对算法进行了实现和优化.  相似文献   

4.
提出了基于完全图的最大约束条件下多支持度闻值关联规则挖掘改进算法。该算法利用完全图与频繁项集之间的关系,以完全图结点的度作为判断标准,使得寻找单个候选项集Ck(k≥3)的复杂度降低了。在由候选集得到频繁集的过程中,该算法避免了对事务数据库的扫描,从而减小了系统的I/O开销。因此,该算法减小了存储空间,加快了挖掘速度,提高了算法的效率。  相似文献   

5.
研究在图集中挖掘频繁结构模式的方法,并提出了一种发现频繁结构的新算法FSP(Frequent Structure Pattem Mining),通过在图中建立了一种新的字典顺序,并把每个图映射成唯一的最小DFS编码作为图的规范形式,从而把图转换成一个序列。基于这种字典顺序,FSP算法不需要生成候选,采用深度优先搜索策略挖掘频繁连通子图。试验结果显示,FSP算法在性能上优于以前的算法。  相似文献   

6.
在关联规则理论的基础上,通过对现有算法的效率分析,在原有A研ori关联规则挖掘算法的基础上,从减少事务数据库中扫描记录量入手,提出一个改进的快速关联规则挖掘算法Fast_Apriori。利用候选项集和频繁项集中的结果对数据库中的记录进行筛选,对不包含候选项集中任何项集的记录和不包含在候选项集中的事物记录直接删除,减少扫描的记录数,提高整个算法的效率。  相似文献   

7.
雷珂  何威 《电子世界》2012,(15):112-114
针对经典频繁子图挖掘算法FFSM(Fast Frequent Subgraph Mining)无法处理有向多重图、无法得到有向频繁子图和大量的虚假警报的缺点,在其基础上提出一种新的频繁子挖掘算法HFFSM(Higher-performance Fast Frequent Subgraph Mining)。通过实验对比分析HFFSM和FFSM表明,HFFSM算法能够很好地处理有向多重图并输出有向频繁子图,并且减少了算法应用时的虚假警报,在算法效率上略有提高,而边的方向上的改进大大提高了算法的整体表现和实用性。  相似文献   

8.
归纳了频繁子图挖掘方法的处理流程,分析评价了频繁子图挖掘的典型算法:广度优先搜索和深度优先搜索的频繁子图挖掘算法,概述了频繁子图挖掘研究的平台--图模型及其产生器,并对频繁子图挖掘方法未来研究方向进行了展望.  相似文献   

9.
由于大部分图挖掘算法都需要利用频繁子图,频繁子图挖掘逐渐成为了数据挖掘领域中的热点研究内容.目前,很多高效的频繁子图挖掘算法已经被提出.其中,gSpan算法是目前公认的最好的频繁子图挖掘算法.然而,在化合物数据集上,还可以利用化合物的特殊结构进一步优化gSpan算法的性能.文献利用了化合物分子结构的对称性和原子类型分布...  相似文献   

10.
最短路径查询是图数据管理与复杂关系挖掘的基本操作之一.本文针对资源描述框架图上的top-k最短路径查询,构造基于组件的索引,并在该索引的基础上实现查询的响应.查询优化阶段,针对查询效率问题,提出频繁路径以及结构剪枝策略,并给出有效性证明.实验表明,本文方法准确返回top-k最短路径并提高92%的查询速率.索引构造时间相比已有方法,提高约56%.同时,索引所占空间仅为原始数据大小的1~1.2倍.  相似文献   

11.
马慧芳  邴睿  赵卫中  常亮 《电子学报》2021,49(1):132-139
图聚集技术是在保留原始图的结构和属性信息的同时,将一个大规模图聚集成简洁的小规模图的技术.随着图的规模不断增加使得图数据变得难以查询和存储,而基于距离的查询,例如最短路径查询,非常依赖图的规模大小.本文提出了面向距离查询的属性加权图聚集算法,在保证节点之间结构和属性相似的同时,保护了节点之间的距离,并有效地减小了图规模...  相似文献   

12.
基于改进哈夫曼编码的大规模动态图可达查询方法   总被引:1,自引:0,他引:1       下载免费PDF全文
随着社交网络分析、生物信息网络分析等新兴应用的涌现和计算机技术的飞速发展,图的规模迅速增长,并且频繁更新,使得对大规模动态图数据的处理需求愈加迫切.现有的面向大规模动态图的可达查询研究成果较少,尚存在索引压缩困难以及图结构待优化等问题.本文提出了一种支持大规模动态图的基于改进哈夫曼编码的可达查询处理方法(Huffman-based Label Reachability,HuffLR).该方法首先对预处理图进行结构上的两次压缩,得到双压缩图;其次,基于双压缩图提出一种前缀label索引,该索引能够有效表达节点间的可达关系;最后,提出双压缩图的演进和可达查询处理及优化算法,主要包括边的插入与删除、节点的插入与删除.实验表明,本文提出的基于改进哈夫曼编码的大规模动态图可达查询处理方法具有良好的可行性和有效性.  相似文献   

13.
针对利用抽象语义(AMR)图来预测摘要子图存在的语义结构不完整问题,该文提出一种基于整数线性规划(ILP)重构AMR图结构的语义摘要算法。首先将数据预处理生成一个AMR总图;然后基于统计特征从AMR总图中抽取出摘要子图重要节点信息;最后利用ILP的方法来对摘要子图中节点关系进行重构,利用完整的摘要子图恢复生成语义摘要。实验结果表明,相比其他语义摘要方法,所提方法的ROUGE值和Smatch值都有显著提高,最多分别提高了9%和14%,该方法有利于提高语义摘要的质量。  相似文献   

14.
The demand for the analysis and application of graph data in various fields is increasing day by day.The management of large-scale graph data with complicated structure and high degree of coupling faces two challenges:one is querying speed too slow,the other is space consumption too large.Facing the problems of long query time and large space occupation in graph data management,a two-level index compression algorithm named GComIdx for graph data was proposed.GComIdx algorithm used the ordered Key-Value structure to store the associated nodes and edges as closely as possible,and constructed two-level index and hash node index for efficient attribute query and neighbor query.Furthermore,GComIdx algorithm used a graph data compressed technology to compress the graph data before it directly stored in hard disk,which could effectively reduce the storing space consumption.The experimental results show that GComIdx algorithm can effectively reduce the initialization time of the graph data calculation and the disk space occupancy of the graph data storing,meanwhile,the query time is less than common graph databases and other Key-Value storage solutions.  相似文献   

15.
刘岩  尹东  张振 《电子技术》2009,36(11):47-49,46
基于关键词的网络图像检索得到的结果往往是海量且无序的,给用户造成不便。本文构建了一个网络图像检索结果重排序系统并进行了仿真。提出了一种利用图像SIFT局部特征构建图像间视觉Graph结构对图像进行聚类的重排序算法,并引入检索关键词的网络翻译以提高检索效率。仿真结果证明,系统的重排序结果满足网络用户的检索期望,验证了算法的有效性。  相似文献   

16.
《电子学报:英文版》2017,(6):1118-1124
Existing decompilers use rule-based algorithms to transform unstructured Control flow graph (CFG) into equivalent high-level programming language constructs with "goto" statements. One problem of such approaches is that they generate a large number of "goto"s in the output code, which reduce the readability and hinder the understanding of input binaries. A global search algorithm is proposed based on structural analysis. This algorithm restructures a CFG and generates fewer number of "goto" statements than the rule-based algorithm does. We also present a Genetic algorithm (GA) for the global search approach to locate near optimal solutions for large CFGs. Evaluation results on a set of real CFGs show that the genetic algorithm-based heuristic for global search is capable of finding high-quality solutions.  相似文献   

17.
In this paper, we approach the design of ID caching technology (IDCT) for graph databases, with the purpose of accelerating the queries on graph database data and avoiding redundant graph database query operations which will consume great computer resources. Traditional graph database caching technology (GDCT) needs a large memory to store data and has the problems of serious data consistency and low cache utilization. To address these issues, in the paper we propose a new technology which focuses on ID allocation mechanism and high-speed queries of ID on graph databases. Specifically, ID of the query result is cached in memory and data consistency is achieved through the real-time synchronization and cache memory adaptation. In addition, we set up complex queries and simple queries to satisfy all query requirements and design a mechanism of cache replacement based on query action time, query times, and memory capacity, thus improving the performance furthermore. Extensive experiments show the superiority of our techniques compared with the traditional query approach of graph databases.  相似文献   

18.
基于攻击图及蚁群算法的安全评估   总被引:3,自引:2,他引:1  
攻击图是网络安全分析人员常用的分析工具之一,文章重点研究了基于攻击图模型的系统安全分析架构,并结合攻击难度提出了应用蚁群算法,在攻击图中获取最小关键攻击集的优化解。同时,文章将实验结果与贪婪算法进行了比较,证明了蚁群算法在该应用上是一种高效的优化算法。  相似文献   

19.
图空间上彩色矢量形态学算子   总被引:1,自引:0,他引:1       下载免费PDF全文
针对现有彩色图像形态学矢量排序算法的缺点,将基于图的二值及灰度形态学扩展到彩色图像,在具备完备格的图空间上定义一种新的彩色矢量形态学算子.为使新算子便于实现,结合图论定义最小生成矢量子图函数及相关理论,并在此基础上提出彩色矢量形态学极值提取算法.实验结果表明,该算子在保存彩色信息的完整及关联性方面优于现有的彩色形态学,避免出现"假色"现象及人为决定主导颜色分量的缺点,同时有效地保护了原图像的纹理不发生较大的变化,较好的保存图像的拓扑结构,有较广的应用前景.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号