共查询到20条相似文献,搜索用时 58 毫秒
1.
基于约简概念格的关联规则提取改进算法* 总被引:3,自引:1,他引:2
概念格是关联规则挖掘领域中的一种重要技术,在概念格上生成所有的频繁项集需要对概念格的节点进行排序并进行一一比较。为了提高在概念格上生成频繁项集的效率,本文提出了一个基于约简概念格的生成频繁项集的新算法。该算法通过利用节点之间的父子关系能够直接生成生成全部频繁项集,省略了对节点进行排序的时间开销,并且大大减少了节点比较的次数,从而提高了频繁项集的生成效率。实验结果证明了其可靠性和高效性。 相似文献
2.
概念格与关联规则发现 总被引:60,自引:4,他引:60
作为数据挖掘核心任务之一的关联规则发现已经得到了广泛的研究。而由二元关系导出的概念格则是一种非常有用的形式化工具。它体现了概念内涵和外延的统一,反映了对象和特征间的联系以及概念间的泛化与例化关系,因此非常适于发现数据中潜在的概念。分析了概念格与关联规则提取之间的关系,根据需要对格结构进行了相应的修改,提出了相应的渐进式生成算法和基于概念格的关联规则提取算法,通过定理和性质对算法进行了说明并对关联规则进行缩减。最后对格结构的复杂性进行了讨论并给出了相应的实验结果。 相似文献
3.
关联规则挖掘是数据挖掘中的一项核心任务,而由二元关系导出的概念格则是一种非常有用的形式化分析工具,它体现了概念内涵和外延的统一,反映了对象和特征间的联系以及概念间的泛化与例化关系。一个概念内涵与一个关联规则中的闭合项集可以一一对应。提出了一种新有基于概念格的关联规则挖掘算法Arca(Association Rule based Concept lAttice)。Arca算法通过概念矩阵构造部分概念格,使概念格中的每个概念对应一个闭合频繁项集。然后生成一些关联规则,在这些关联规则上通过定义了四个算子来生成了所有关联规则。 相似文献
4.
基于概念格的关联规则发现 总被引:9,自引:0,他引:9
关联规则是数据库中有价值的一类规律,国内外学者已经对它进行了广泛的研究,由二元关系导出的概念格作为一种非常有用的形式化工具,体现了概念内和外延的统一,反映了对象和特征间的联系以及概念的泛化与例化关系,因此非常适于发现数据中潜在的概念。本文报概念格的关联规则提取之间的关系,根据需要对格结构进行了相应的修改,提出了概念格结点内涵缩减概念,给出了相应的渐进式生成算法和基于概念格的关联规则提取算法,并通过 相似文献
5.
6.
基于概念格的关联规则挖掘 总被引:2,自引:0,他引:2
关联规则的挖掘是知识发现领域重要的研究方向之一,因此开展这方面的研究是很有意义的。论文给出了一种基于概念格的关联规则的算法,该算法首先通过约化形式背景,然后通过给定的阈值在约简的背景上建格,最后在格上提取符合条件的关联规则。例子说明了该算法的可行性和有效性。 相似文献
7.
8.
关联规则是数据挖掘中的核心任务之一,近年来国内外对关联规则算法的改进取得了比较大的成果.概念格是由二元关系导出的形式化工具.体现了概念内涵和外延的统一,非常适合于发现数据中的潜在关系,因此关联规则的提取也是概念格的一个主要的应用领域,极大的提高了关联规则的挖掘效率,然而由于缺乏领域知识的指导,所挖掘出的规则有些是无意义的或无法满足用户的需要,所以在规则的提取中需要引入领域知识,而领域本体是领域知识的清晰而结构化的表示,因此提出了应用领域本体对生成的概念格进行调整,从而实现对规则提取的指导,以发掘出高层关联规则以及多层次间的关联规则,以满足用户的需要. 相似文献
9.
提出了一种新的基于模糊概念的量化关联规则挖掘方法,该方法利用在量化属性域上定义的一组模糊概念表示属性间的关联关系,克服了传统的离散分区法的不足,使得规则的表示自然,简明,有利于专家理解,同时,给出了挖掘算法。 相似文献
10.
概念指导的关联规则的挖掘 总被引:4,自引:0,他引:4
关联规则是数据依赖关系泊有效描述方法,是知识发现研究的重要内容,传统的关联规则挖掘算法缺少挖掘的针对性,挖掘速度慢,挖掘效果难于理解,挖掘析数量巨大,需要进行大量的筛选以便抽取出有用规则,文中提出了将概念融入挖掘过程中,提高挖掘的效率和挖掘的针对性的方法,给出了概念指导的关联规则挖掘算法CGARM和大数据库中概念的交互式生成方法。算法CGARM是对基于分类的挖掘算法的拓展。实验结果表明,算法CGA 相似文献
11.
关联规则的快速提取算法 总被引:1,自引:0,他引:1
针对基于频繁项集的关联规则挖掘算法效率低,需要多次扫描数据库且生成冗余候选项集问题,该文利用频繁项集的Aprior性质和概念格的基本思想提出一种关联规则提取算法,利用极大频繁项集来进行规则提取,去除了多数冗余的候选项集,提高了提取效率。 相似文献
12.
基于分布数据库的快速关联规则挖掘算法 总被引:8,自引:0,他引:8
关联规则发现是数据挖掘的重要研究内容,随着数据库中数据的不断增加,大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。分布式数据库环境下的关联规则挖掘算法中,时间开销主要体现在两方面(:1)频繁项目集的确定;(2)网络的通讯量。为了解决第一个问题,文章提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些”或”、”与”、”异或”等逻辑运算操作,显著降低了算法的实现难度。将该算法与DMA算法相结合提出改进算法FDMA。理论分析和实验结果表明,算法FDMA大大提高了关联规则挖掘的效率,算法是有效可行的。 相似文献
13.
LIU Zhi- yi 《数字社区&智能家居》2008,(18)
对关联规则算法进行了研究和分析,基于候选集的Apriori-like算法需要反复扫描数据库,并产生大量的候选集,在挖掘低支持度、长模式的规则时效率低下。针对算法的缺陷,该文提出了一种PS算法,优化了关联规则的挖掘。实验结果证明了该算法的有效性。 相似文献
14.
多层次模糊关联规则挖掘算法 总被引:1,自引:0,他引:1
该文将模糊技术和概念分层应用到关联规则的挖掘中,提出了多层次模糊关联规则挖掘算法。并且以Food-Mark2000数据库为实验对象,对该算法的性能进行分析,实验结果表明该算法具有较好的执行效率和较好的可扩展性,适合于对大型数据库进行挖掘。 相似文献
15.
一种高效的维内关联规则挖掘算法研究 总被引:1,自引:0,他引:1
通过对数据立方体的结构特征进行深入分析,结合传统的关联规则挖掘算法.提出了一种在数据立方体中进行维内关联规则挖掘的新颖算法,该算法通过有效组织挖掘过程中的数据结构,降低对立方体的扫描次数,并充分利用联机分析处理技术.从而大大降低了执行时间,提高了执行效率. 相似文献
16.
基于关联图的关联规则挖掘算法研究 总被引:15,自引:0,他引:15
在挖掘关联规则的过程中 ,一个关键的步骤是产生频繁项目集 .本文给出一种基于关联图的关联规则挖掘算法 ,并将它与性能比较好的关联规则挖掘算法 DHP进行了比较 ,结果表明 ,本文的算法优于 DHP算法 相似文献
17.
随着大型数据库系统在各行业普及,数据库中存储的数据量急剧增大,数据挖掘是从海量数据中挖掘有效或重要信息的过程。关联规则挖掘作为数据挖掘的重要研究课题,被广泛地应用。伴随挖掘数据库的规模不断发生变化,对数据的需求也会有所不同,如何从扩展数据库中高效地对已经推导出的关联规则进行更新具有非常重要的应用价值,这就是所谓的增量式挖掘关联规则的问题。 相似文献
18.
关联规则挖掘快速更新算法的研究和实现 总被引:2,自引:0,他引:2
关联规则挖掘是数据挖掘的主要方式之一,它可以分解为“大项集的生成”和发现关联规则两个子问题。分别针对以上两个子问题,文章提出了它们的快速更新算法。最后对算法的运行状况进行比较和性能分析。 相似文献
19.
时态关联规则挖掘是针对在一段时间范围内的关联挖掘,在现实中有较多的应用。现有的大多数时态关联挖掘算法或者需要多次扫描数据库,或者没有考虑各个项在数据集上出现或结束时间上的不同,因而挖掘性能受到较大的制约。为此,本文提出一种增量式的面向具有不同时间出现与结束的项的时态关联规则挖掘算法。为减少存储方面的开销,只需保存已挖掘过的历史数据集中的频繁1项集。为了减少数据的扫描量,通过有效的剪枝策略,有选择性地扫描相关事务项,至多只需扫描一次完整的数据库。实验证明,该算法具有较好的挖掘性能。 相似文献
20.
挖掘关联规则的并行算法 总被引:3,自引:0,他引:3
从大型数据库中挖掘关联规则是数据挖掘中一个重要的课题 .从挖掘要求的时间和空间上看 ,传统的顺序算法已很难适应于现实中不断增大的数据库规模 .而研究和发展高性能、可扩展的并行算法对解决这一问题就显得十分必要 .本文介绍了挖掘关联规则一些主要的并行算法 ,并对它们进行了一定分析 ,指出了发展并行算法要考虑的一些问题 . 相似文献