共查询到20条相似文献,搜索用时 62 毫秒
1.
一种高效的多层和概化关联规则挖掘方法 总被引:3,自引:1,他引:3
通过对分类数据的深入研究,提出了一种高效的多层关联规则挖掘方法:首先,根据分类数据所在的领域知识构建基于领域知识的项相关性模型DICM(domain knowledge-based item correlation model),并通过该模型对分类数据的项进行层次聚类;然后,基于项的聚类结果对事务数据库进行约简划分;最后,将约简划分后的事务数据库映射至一种压缩的AFOPT树形结构,并通过遍历AFOPT树替代原事务数据库来挖掘频繁项集.由于缩小了事务数据库规模,并采用了压缩的AFOPT结构,所提出的方法有效地节省了算法的I/O时间,极大地提升了多层关联规则的挖掘效率.基于该方法,给出了一种自顶向下的多层关联规则挖掘算法TD-CBP-MLARM和一种自底向上的多层关联规则挖掘算法BU-CBP-MLARM.此外,还将该挖掘方法成功扩展至概化关联规则挖掘领域,提出了一种高效的概化关联规则挖掘算法CBP-GARM.通过大量人工随机生成数据的实验证明,所提出的多层和概化关联规则挖掘算法不仅可以确保频繁项集挖掘结果的正确性和完整性,还比现有同类最新算法具有更好的挖掘效率和扩展性. 相似文献
2.
概化关联规则挖掘作为数据挖掘领域一个重要的拓展性研究课题,首先提出了一种概化扩展自然序树(generalized extended canonical-order tree,GECT)结构及其增量挖掘算法GECT-IM.该算法对原始分类事务数据库只扫描一次,就可以将所有交易信息映射至一棵压缩格式的GECT,然后通过对更新交易数据集扫描得到更新数据集中各项集的计数,结合相关性质及运算就可以发现大部分更新后的概化频繁项集;其次,针对GECT规模较大以及GECT-IM 算法仍然可能需要遍历初始GECT树的局限,在界定数据库更新和重构概念的基础上,基于一种可量化度量的准最小支持度阈值,提出了一种改进的准频繁概化扩展自然序树(pre-large generalized extended canonical-order tree,PGECT)结构及其增量挖掘算法PGECT-IM.由于有效避免了对初始GECT进行遍历的情形,从而进一步提升了概化关联规则增量挖掘效率.实验证明,提出的概化关联规则增量挖掘算法 GECT-IM 及其优化算法PGECT-IM,比现有增量挖掘算法具有更高的挖掘效率和更好的扩展性. 相似文献
3.
4.
关联分类具有较高的分类精度和较强的适应性,然而由于分类器是由一组高置信度的规则构成,有时会存在过度拟合问题。提出了基于规则兴趣度的关联分类(ACIR)。它扩展了TD-FP-growth算法,使之有效地挖掘训练集,产生满足最小支持度和最小置信度的有趣的规则。通过剪枝选择一个小规则集构造分类器。在规则剪枝过程中,采用规则兴趣度来评价规则的质量,综合考虑规则的预测精度和规则中项的兴趣度。实验结果表明该方法在分类精度上优于See5、CBA和CMAR,并且具有较好的可理解性和扩展性。 相似文献
5.
基于关联规则的数据挖掘算法是人工智能和数据库研究的热点之一。本文提出的关联规则算法通过压缩规模,及时删除数据库中无用的事务记录,减少了事务数据的数量,提高了算法的执行效率。本算法能够生成较小规模的频繁候选集,有效减少了生成的候选集的规模,实现方便,在很大程度上也提高了效率。 相似文献
6.
基于关联图的关联规则挖掘算法研究 总被引:15,自引:0,他引:15
在挖掘关联规则的过程中 ,一个关键的步骤是产生频繁项目集 .本文给出一种基于关联图的关联规则挖掘算法 ,并将它与性能比较好的关联规则挖掘算法 DHP进行了比较 ,结果表明 ,本文的算法优于 DHP算法 相似文献
7.
关联规则挖掘算法在分类中的应用研究 总被引:1,自引:0,他引:1
提出了一个基于关联规则挖掘算法的医疗数据分类方法。介绍了关联规则的理论基础、关联规则挖掘算法及其在医疗数据挖掘中的应用方法,并利用介绍的算法对乳腺癌数据进行挖掘。获得了分类的实验结果,该模型系统达到了较高的分类准确率,证明了数据挖掘在辅助医疗诊断中有着广泛的应用前景。 相似文献
8.
关联规则和分类规则挖掘算法的改进与实现 总被引:5,自引:0,他引:5
对Apriori关联规则挖掘算法提出了一种改进方法,使其可以有效地压缩数据规模,提高了原Apriori算法的执行效率。此外,还对OCI分类规则挖掘算法提出了改进,扩展了该算法的适用范围。同时,该采用这两个改进算法实现了一个数据挖掘原型系统。 相似文献
9.
提出了一种基于压缩矩阵运算的电信告警关联规则挖掘算法.它解决了apriori等算法需多次扫描数据库的问题,通过扫描告警事务库并进行压缩变换得到压缩告警关联矩阵,对关联矩阵进行运算得到告警间的关联规则.仿真实验证明,该算法与apriori等算法相比,时间效率有了明显提高,同时有效节约了存储空间. 相似文献
10.
刘晓蔚 《计算机应用与软件》2015,32(1):313-315,319
传统的类关联规则挖掘方法在挖掘完整的规则数据集时往往需要消耗很长的时间。为了解决这个问题,提出一种高效的基于等价类规则树的类关联规则挖掘算法。首先,通过分析等价类规则树挖掘类关联规则算法存在的耗时问题,设计一个树结构存储数据集的频繁项集;接着,基于这棵树推导出一些修正树上节点和减少节点信息计算量的定理;最后,利用这些定理得到一个有效的适用于挖掘类关联规则的算法。实验结果表明,与其他较为先进的基于等价类规则树的关联规则挖掘算法相比,所提算法更加高效。 相似文献
11.
许多研究表明关联分类具有较高的分类准确率,然而,大多数关联分类基于"支持度-置信度"框架,在不平衡数据集中,置信度和支持度都偏向产生多数类的规则,因此,少数类的实例容易被错误分类。针对上述问题,提出了一种基于相关规则的不平衡数据的关联分类算法。该算法挖掘频繁且互关联的项集,在以该项集为前件的分类规则中选取提升度最大的规则。规则按结合了提升度、置信度和补类支持度(CCS)的规则强度进行排序。实验表明,该算法取得了较高的平均分类准确率且在分类少数类的实例时具有更高的准确率。 相似文献
12.
广义关联规则及算法研究 总被引:2,自引:0,他引:2
挖掘广义关联规则是数据挖掘研究的一个重要方面,数据挖掘领域的研究者在挖掘广义关联规则上作了大量的工作,使之成为一个具有普遍和实用意义的数据挖掘方法。文章就挖掘广义关联规则的算法进行了深入的研究。 相似文献
13.
14.
项目的分类通常是呈模糊类层次,该文基于模糊类层次的概念,讨论模糊关联规则支持度和置信度的计算,并给出挖掘广义模糊关联规则的两个扩展算法。 相似文献
15.
一种改进的关联规则算法探讨 总被引:4,自引:1,他引:4
随着以数据库、数据仓库等数据仓储技术为基础的信息系统在各行各业的应用,使海量数据不断产生。而数据采集手段的丰富,使获取、保存大量数据变得容易,从庞杂的数据中提取有用的知识和信息是数据挖掘的主要任务,关联规则是数据挖掘领域的一个重要分支。该文以数据挖掘为研究背景,讨论了数据挖掘中确定关联规则的一种方法,并提出改进算法。在研究算法的同时提供了一种数据项的二进制编码技术,对于提高数据信息的处理能力和可靠性有一定意义。 相似文献
16.
一种基于图像的关联规则发现算法的研究 总被引:6,自引:0,他引:6
论文介绍的是在图像数据库中的知识发现,介绍了一种在二维彩色图像中发现关联规则的挖掘算法。算法主要由四步组成:属性抽取,对象鉴别,辅助图像创建和对象挖掘。重点是关于图像内容的数据挖掘,并不涉及到其它的知识领域。文章最后对所提出的算法进行了分析。 相似文献
17.
18.
基于Apriori算法的水平加权关联规则挖掘 总被引:19,自引:2,他引:19
关联规则挖掘可以发现大量数据中项集之间有趣的关联或相关联系,并已在许多领域得到了广泛的应用。目前业界已经提出了许多发现关联规则的算法,这些算法都认为每个数据对规则的重要性相同。但在实际应用中,用户会比较倾向于自己最感兴趣或认为最重要的那部分项目,因此有必要加强这些项目对规则的影响,同时减弱另一些用户兴趣不大或认为不重要的项目对规则的影响。为此,论文提出了水平加权关联规则的问题,并结合Apriori算法,加以改进,给出了关于该问题的解决方案及有效算法New_Apriori。 相似文献
19.
基于关联规则的数据挖掘技术的快速算法 总被引:11,自引:1,他引:11
提出了一种改进的Apriori算法的数据挖掘模式,探讨了对其中的生成候选频繁项目集、生成强关联规则等几个关健步骤运用标准SQL语言的算法实现。 相似文献
20.
针对传统多层关联分类挖掘产生大量冗余规则而影响分类效率的问题,提出了一种基于类FP-tree的多层关联分类器MACCF(Multi-level Associative Classifier based on Class FP-tree)。该分类器依据事务的类标号划分训练集,采用闭频繁模式(CLOSET+)产生完全候选项目集,通过设计适当的类内规则剪枝策略和类间规则剪枝策略,减少了大量冗余的分类规则,提高了分类的准确率;采用交又关联规则方法,解决了交叉层数据的分类问题,实验结果
表明了算法的高效性。 相似文献