首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于图的关联规则挖掘高效算法研究   总被引:4,自引:0,他引:4  
通过对文献[1]中介绍的基于图的关联规则挖掘算法的详细分析,提出了一种新的基于完全子图的关联规则挖掘算法。该算法利用完全子图与频繁项集的对应关系,以完全子图结点的度作为判断标准,完全避免了不必比较项目之间的比较:同时通过设置关联图结点的order值,完全避免了相同项目集的重复比较,从而在寻找k-项频繁集(k〉3)的过程中,时间复杂度远小于原算法的1/k-1。因此,该算法减小了存傅空间,加快了挖掘速度,提高了算法的效率。  相似文献   

2.
频繁子图挖掘算法研究   总被引:3,自引:1,他引:2  
图像能表达丰富语义,但增加了数据结构的复杂性和感兴趣子结构的挖掘难度。综合应用图论知识和数据挖掘的各种技术,对图像进行规范化编码,通过连接和扩展操作产生所有候选子图,引用嵌入集概念,计算候选子图的支持度和频繁度。提出频繁子图挖掘算法FSubgraphM,能从图数据库中挖掘频繁导出子图。  相似文献   

3.
针对结构化程度差、表达形式各异的文本数据,提出了一种基于文本信息的故障序列模式挖掘算法,用于发掘故障之间的时序关系。为从文本记录的故障信息中挖掘故障规律,首先将文本信息向量化,对故障文本信息进行相似度衡量,将表达相同意义的故障归为一类。在此基础上根据故障特性,提出最大窗口阈值、最小共现度阈值的概念,构建故障序列模式挖掘算法框架。最后对某型飞机文本故障信息进行序列模式挖掘,找出了正确的故障序列关系。实例验证了所提算法是正确有效的。  相似文献   

4.
李智慧  林吓洪  申瑞民 《计算机仿真》2010,27(1):313-315,337
利用海量的生物网络数据发现功能模块越来越受到人们的重视,从蛋白质建模的网络图中挖掘高连通子图是其中一个很重要的问题,然而由于数据规模巨大,现有的算法在时间效率上无法胜任实际的应用需求。通过深入研究高连通图的性质定理,设计了一个高连通子图的贪心挖掘算法(HCSGM)算法,在时间复杂度上比HCS算法提高了一个数量级。实验结果表明,HCSGM算法在仿真数据上的挖掘结果优于HCS算法,并且能够从大规模网络图中快速地进行高连通子图挖掘,从而高效地从蛋白质相互作用数据库中挖掘出功能模块。  相似文献   

5.
基于关联图的关联规则挖掘算法研究   总被引:15,自引:0,他引:15  
在挖掘关联规则的过程中 ,一个关键的步骤是产生频繁项目集 .本文给出一种基于关联图的关联规则挖掘算法 ,并将它与性能比较好的关联规则挖掘算法 DHP进行了比较 ,结果表明 ,本文的算法优于 DHP算法  相似文献   

6.
图挖掘是数据挖掘的一个重要研究方向,而图挖掘主要集中在图数据集内频繁子图的挖掘。频繁子图挖掘技术的关键是建立有效机制减少冗余候选子图,以便高效计算和处理所需的频繁子图。提出了一种基于路径的频繁子图挖掘算法,该算法首先找出所有频繁边从而挖掘出频繁单路径,然后通过组合、双射和操作扩展出较多的频繁路径,再通过连接操作产生所有频繁子图候选集。通过定理证明了该算法的正确性和完整性,从理论上分析了该算法时间复杂度低于现有的算法,最后进行了2个图数据集实验,在候选集产生的数量和时间性能2方面验证了算法的优越性。  相似文献   

7.
魏琳 《福建电脑》2014,(9):93-96
以慢性胃炎病例为研究背景,挖掘出症状、病机这两大类中医命名实体之间的关联关系,通过Sim Rank的数据挖掘方法对慢性胃炎的发病机理进行相似度计算,最终抽取挖掘出慢性胃炎发病机理之间隐性关联的本质。  相似文献   

8.
离群数据挖掘是指从大量数据中挖掘明显偏离、不满足一般行为模式的数据。现有的离群数据挖掘算法大多对密集的交易数据库缺乏有效的处理,文中提出了一种高效的基于规则的离群挖掘算法。该算法使用了多层最大离群支持度及最小离群兴趣度,计算1-离群条件集的幂集,并在数据结构中存储了交易标识符链表,使得扫描数据库的次数仅为一次,从而提高了挖掘的速度、效率且使得结果更具有决策意义。文中使用此算法对某一商场的部分销售数据库进行了实验,结果表明该算法能有效、迅速地发现密集数据库中的离群数据。  相似文献   

9.
张璐璐  贾瑞玉  李杰 《微机发展》2006,16(12):73-75
离群数据挖掘是指从大量数据中挖掘明显偏离、不满足一般行为模式的数据。现有的离群数据挖掘算法大多对密集的交易数据库缺乏有效的处理,文中提出了一种高效的基于规则的离群挖掘算法。该算法使用了多层最大离群支持度及最小离群兴趣度,计算1-离群条件集的幂集,并在数据结构中存储了交易标识符链表,使得扫描数据库的次数仅为一次,从而提高了挖掘的速度、效率且使得结果更具有决策意义。文中使用此算法对某一商场的部分销售数据库进行了实验,结果表明该算法能有效、迅速地发现密集数据库中的离群数据。  相似文献   

10.
针对大型胃癌诊断数据库中疑似病例的确诊问题,提出了一种聚类挖掘算法,该算法使用匹配系数计算相似度来确定疑似病例,对于大型的数据库具有较好的优越性能。研究结果表明,运用所提算法在医学领域确定疑似病例能取得较好效果。  相似文献   

11.
图的数据挖掘算法研究   总被引:5,自引:1,他引:5  
在计算机科学领域,图是最复杂的数据结构之一。它具有直观的表达形式,无论在研究领域还是在商业领域都有着广泛的应用。因此,如何从大量的图中挖掘出令人感兴趣的子图模式已经成为数据挖掘领域研究的热点之一。结合图论知识,对经典的Apriori算法进行改进,提出了一种图的数据挖掘方法,该方法能够有效地进行频繁子图的挖掘。  相似文献   

12.
在过去的几年,结构化数据挖掘的需求日渐兴起,图是计算机学科和离散数学中最好的结构数据研究之一,基于图的数据挖掘已越来越广泛.本文介绍了基于图的数据挖掘的理论基础及其研究方法.  相似文献   

13.
Citation graphs representing a body of scientific literature convey measures of scholarly activity and productivity. In this work we present a study of the structure of the citation graph of the computer science literature. Using a web robot we built several topic-specific citation graphs and their union graph from the digital library ResearchIndex. After verifying that the degree distributions follow a power law, we applied a series of graph theoretical algorithms to elicit an aggregate picture of the citation graph in terms of its connectivity. We discovered the existence of a single large weakly-connected and a single large biconnected component, and confirmed the expected lack of a large strongly-connected component. The large components remained even after removing the strongest authority nodes or the strongest hub nodes, indicating that such tight connectivity is widespread and does not depend on a small subset of important nodes. Finally, minimum cuts between authority papers of different areas did not result in a balanced partitioning of the graph into areas, pointing to the need for more sophisticated algorithms for clustering the graph.  相似文献   

14.
科技文献之间的相互引证关系形成了科学思想交流、借鉴的媒介和轨迹。面对数量日益庞大的科技文献,如何为科研工作者提供最快捷、最准确的检索方法,帮助其找到最具有针对性的文献,是文献检索系统追求的目标。文章通过对科技文献的引文网络结构的研究,提出了一种基于迭代运算引文排序技术的科技文献检索系统的设计方法。  相似文献   

15.
由于流程挖掘技术的快速发展, 流程挖掘算法种类增加迅速, 已有的算法研究文章介绍已不全面. 针对这一情况对迄今为止的流程挖掘主要算法进行系统性的分析总结. 首先对流程挖掘算法现状进行总体分析, 接着根据算法特性将流程挖掘算法分为传统的流程挖掘算法和基于计算智能和机器学习技术的流程挖掘算法两大类, 简要介绍其中代表性算法...  相似文献   

16.
非线性降维和半监督学习都是近年来机器学习的热点。将半监督的方法运用到非线性降维中,提出了基于图的半监督降维的算法。该算法用等式融合的方法推出了标记传播算法的另一种表达形式,用标记传播的结果作为初始的数据映射,然后在图谱张成的线性空间中寻找最逼近初始映射的数据作为最后的半监督降维的结果。实验表明,所提算法可以获得平滑的数据映射,更接近于理想的降维效果。与标记传播算法、图谱逼近算法、无监督的降维算法的比较也体现出本算法的优越性。  相似文献   

17.
基于图的适应性多连接查询优化算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种基于图的适应性多连接查询优化算法,分析关系结果集到达时间和结果集大小之间的关系,借鉴适应性查询优化的动态调整思想,对基于图的多连接查询进行改进。仿真实验结果表明,该算法在最好情况下的时间复杂度为O(n),且能有效提高查询效率。  相似文献   

18.
频繁集挖掘算法研究   总被引:2,自引:0,他引:2  
归纳分析了关联规则的典型挖掘算法及其思想,并通过实例比较各算法之间的差别,同时讨论了各种算法的优化技术,分析了他们的适应性及优缺点.  相似文献   

19.
频繁项集挖掘算法研究   总被引:2,自引:0,他引:2  
频繁项集挖掘是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法的核心,所以提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一.本文以频繁项集挖掘算法的搜索方式和计数方式为主线,分析频繁项集挖掘中的代表性算法及其中的关键技术和方法,对近年来相关研究的新进展做了介绍和评述,并指出了未来的研究方向.  相似文献   

20.
多关系数据挖掘根据表示形式可以分为基于图的MRDM和基于逻辑的MRDM.本文讨论了基于图的数据挖掘和基于图的关系学习之间的关系,重点介绍基于图的关系学习算法Subdue及其优缺点,针对它的缺点提出优化的算法F_Subdue,改进了子图同构的计算,减少了子图同构的次数.在实际和人工数据集上运行的实验结果显示它比原算法更加有效率.最后给出结论并指明将来的工作.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号