共查询到20条相似文献,搜索用时 78 毫秒
1.
基于图的关联规则挖掘高效算法研究 总被引:4,自引:0,他引:4
通过对文献[1]中介绍的基于图的关联规则挖掘算法的详细分析,提出了一种新的基于完全子图的关联规则挖掘算法。该算法利用完全子图与频繁项集的对应关系,以完全子图结点的度作为判断标准,完全避免了不必比较项目之间的比较:同时通过设置关联图结点的order值,完全避免了相同项目集的重复比较,从而在寻找k-项频繁集(k〉3)的过程中,时间复杂度远小于原算法的1/k-1。因此,该算法减小了存傅空间,加快了挖掘速度,提高了算法的效率。 相似文献
2.
频繁子图挖掘算法研究 总被引:3,自引:1,他引:2
图像能表达丰富语义,但增加了数据结构的复杂性和感兴趣子结构的挖掘难度。综合应用图论知识和数据挖掘的各种技术,对图像进行规范化编码,通过连接和扩展操作产生所有候选子图,引用嵌入集概念,计算候选子图的支持度和频繁度。提出频繁子图挖掘算法FSubgraphM,能从图数据库中挖掘频繁导出子图。 相似文献
3.
4.
利用海量的生物网络数据发现功能模块越来越受到人们的重视,从蛋白质建模的网络图中挖掘高连通子图是其中一个很重要的问题,然而由于数据规模巨大,现有的算法在时间效率上无法胜任实际的应用需求。通过深入研究高连通图的性质定理,设计了一个高连通子图的贪心挖掘算法(HCSGM)算法,在时间复杂度上比HCS算法提高了一个数量级。实验结果表明,HCSGM算法在仿真数据上的挖掘结果优于HCS算法,并且能够从大规模网络图中快速地进行高连通子图挖掘,从而高效地从蛋白质相互作用数据库中挖掘出功能模块。 相似文献
5.
基于关联图的关联规则挖掘算法研究 总被引:15,自引:0,他引:15
在挖掘关联规则的过程中 ,一个关键的步骤是产生频繁项目集 .本文给出一种基于关联图的关联规则挖掘算法 ,并将它与性能比较好的关联规则挖掘算法 DHP进行了比较 ,结果表明 ,本文的算法优于 DHP算法 相似文献
6.
图挖掘是数据挖掘的一个重要研究方向,而图挖掘主要集中在图数据集内频繁子图的挖掘。频繁子图挖掘技术的关键是建立有效机制减少冗余候选子图,以便高效计算和处理所需的频繁子图。提出了一种基于路径的频繁子图挖掘算法,该算法首先找出所有频繁边从而挖掘出频繁单路径,然后通过组合、双射和操作扩展出较多的频繁路径,再通过连接操作产生所有频繁子图候选集。通过定理证明了该算法的正确性和完整性,从理论上分析了该算法时间复杂度低于现有的算法,最后进行了2个图数据集实验,在候选集产生的数量和时间性能2方面验证了算法的优越性。 相似文献
7.
以慢性胃炎病例为研究背景,挖掘出症状、病机这两大类中医命名实体之间的关联关系,通过Sim Rank的数据挖掘方法对慢性胃炎的发病机理进行相似度计算,最终抽取挖掘出慢性胃炎发病机理之间隐性关联的本质。 相似文献
8.
离群数据挖掘是指从大量数据中挖掘明显偏离、不满足一般行为模式的数据。现有的离群数据挖掘算法大多对密集的交易数据库缺乏有效的处理,文中提出了一种高效的基于规则的离群挖掘算法。该算法使用了多层最大离群支持度及最小离群兴趣度,计算1-离群条件集的幂集,并在数据结构中存储了交易标识符链表,使得扫描数据库的次数仅为一次,从而提高了挖掘的速度、效率且使得结果更具有决策意义。文中使用此算法对某一商场的部分销售数据库进行了实验,结果表明该算法能有效、迅速地发现密集数据库中的离群数据。 相似文献
9.
10.
针对大型胃癌诊断数据库中疑似病例的确诊问题,提出了一种聚类挖掘算法,该算法使用匹配系数计算相似度来确定疑似病例,对于大型的数据库具有较好的优越性能。研究结果表明,运用所提算法在医学领域确定疑似病例能取得较好效果。 相似文献
11.
12.
13.
Citation graphs representing a body of scientific literature convey measures of scholarly activity and productivity. In this work we present a study of the structure of the citation graph of the computer science literature. Using a web robot we built several topic-specific citation graphs and their union graph from the digital library ResearchIndex. After verifying that the degree distributions follow a power law, we applied a series of graph theoretical algorithms to elicit an aggregate picture of the citation graph in terms of its connectivity. We discovered the existence of a single large weakly-connected and a single large biconnected component, and confirmed the expected lack of a large strongly-connected component. The large components remained even after removing the strongest authority nodes or the strongest hub nodes, indicating that such tight connectivity is widespread and does not depend on a small subset of important nodes. Finally, minimum cuts between authority papers of different areas did not result in a balanced partitioning of the graph into areas, pointing to the need for more sophisticated algorithms for clustering the graph. 相似文献
14.
科技文献之间的相互引证关系形成了科学思想交流、借鉴的媒介和轨迹。面对数量日益庞大的科技文献,如何为科研工作者提供最快捷、最准确的检索方法,帮助其找到最具有针对性的文献,是文献检索系统追求的目标。文章通过对科技文献的引文网络结构的研究,提出了一种基于迭代运算引文排序技术的科技文献检索系统的设计方法。 相似文献
15.
16.
17.
18.
19.
频繁项集挖掘算法研究 总被引:2,自引:0,他引:2
频繁项集挖掘是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法的核心,所以提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一.本文以频繁项集挖掘算法的搜索方式和计数方式为主线,分析频繁项集挖掘中的代表性算法及其中的关键技术和方法,对近年来相关研究的新进展做了介绍和评述,并指出了未来的研究方向. 相似文献