首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
一种划分多值属性的关联规则挖掘算法   总被引:1,自引:0,他引:1  
提出了一种新的划分方法求拐点,可以根据数据的实际分开布将数量型定义划分为多个定性概念,这种划分符合数据分布的自然性并有利于模式的解释,从而最终得到概括的、易理解的、有效的关联规则。  相似文献   

2.
一种新的多值属性关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
为解决多值属性的关联规则挖掘问题给出相似属性集合矩阵的概念,提出一种新的多值关联规则挖掘算法——Qarmasm算法。该算法无须扩展事务属性,约简效率高,能够直接生成候选频繁项集,求出其支持度,有效地发现频繁项。给出算法的描述及其复杂性分析。与经典算法的对比表明,该算法具有明显的优势。  相似文献   

3.
本文根据关联规则和分类规则的概念与表示形式,指出在关联规则挖掘过程中如果指定挖掘与一个确定的项相关联,那么就是分类规则挖掘了,论述了分类规则是特殊情况下的关联规则,并指出在这种特殊情况下,关联规则所具有的特征;然后根据这一论述,提出了一种在关联规则挖掘算法中利用限制条件概率分布来发现分类规则的算法。  相似文献   

4.
针对Apriori算法进行多值属性关联规则挖掘时效率低下的问题,提出量化Apriori算法.利用多值属性数据特点改变项集存储格式,采用类似矩阵的数据结构存储项集,提高遍历数据库时统计计数的速度,使用类似矩阵的加法运算改进连接操作,减少无效候选项集的产生.实验结果表明,相比Apriori算法,该算法执行效率有较大提高.  相似文献   

5.
一种基于决策树的快速关联规则挖掘算法   总被引:2,自引:0,他引:2  
陈雪飞 《计算机科学》2008,35(7):252-254
本文对关联规则的挖掘问题进行了深入研究.在总结现有算法优缺点的基础上,提出了一种新的基于决策树的快速关联规则挖掘算法(RABDT),结合决策树的构造过程,给出了算法的原理和实现步骤,并通过实验对比验证了算法的有效性.  相似文献   

6.
吕真  李丹 《数字社区&智能家居》2011,(6):1234-1235,1244
该文通过对Apriori算法的基本思想和性能的研究剖析,认为Apriori算法存在一些不足;并且根据这些不足提出了相应的改进UDApriori算法对经典算法进行优化,从而得到一种改进的Apriori算法,与原算法相比运算效率大大提高.  相似文献   

7.
对关联规则算法进行了研究和分析,基于候选集的Apriori-like算法需要反复扫描数据库,并产生大量的候选集,在挖掘低支持度、长模式的规则时效率低下。针对算法的缺陷,该文提出了一种PS算法,优化了关联规则的挖掘。实验结果证明了该算法的有效性。  相似文献   

8.
一种基于栈变换的高效关联规则挖掘算法   总被引:12,自引:0,他引:12  
在一个模式信息保全引理的基础上,提出了一个基于频繁模式栈变换的关联规则挖掘算法FPST,给出了相应的栈构造和栈变换的算法描述,并进行了算法的性能分析和比较试验,结果表明算法性能优良。  相似文献   

9.
通过不同决策类之间的比较首先寻找核属性,进而以核属性为基础构造不含核属性的布尔区分矩阵,并利用吸收律和去重操作简化区分矩阵;然后以区分矩阵为基础,采用类似关联规则挖掘的Apriori算法思想逐级寻找系统的所有约简.理论分析和实验表明算法是正确且有效率的.  相似文献   

10.
Apriori算法是经典的频繁项目集生成算法,在数据挖掘界起着里程碑的作用。但是该算法要求多次扫描可能非常大的交易数据库。文章在Apriori算法的基础上,提出了一种改进的关联规则挖掘算法-GBARM。该算法能够使得每次扫描的事务数大大减少,并且能够逐步减小候选k-项集的规模,从而改善算法的性能。  相似文献   

11.
针对安全审计系统中存在的智能程度低、日志信息没有充分利用的问题,提出一个基于关联规则挖掘的安全审计系统。该系统充分利用已有审计日志,结合数据挖掘技术,建立用户及系统的行为模式数据库,做到及时发现异常情况,提高了计算机的安全性。在传统Apriori算法的基础上提出一种改进的E-Apriori算法,该算法可以缩小待扫描事务集合的范围,降低算法的时间复杂度,提高运行效率。实验结果表明基于关联规则挖掘的审计系统对攻击类型的识别能力提升在10%以上,改进的E-Apriori算法相比经典Apriori算法和FP-GROWTH算法在性能上得到了提高,特别是在大型稀疏数据集中最高达到51%。  相似文献   

12.
利用时态关联规则的分析,可以得到一系列相关性的项目集合,从而为决策提供更加有利的帮助和支持。在研究了传统的静态关联规则的基础上,提出了一种以交易规模的变化率为处理对象,即考虑各类项目交易量的变动状况的时态关联规则的表述与挖掘方法,并对其表述形式及算法实现进行了探讨。  相似文献   

13.
通过引入聚类竞争机制,提出了一种基于免疫聚类竞争的关联规则挖掘算法。将数据原始记录和候选模式分别作为抗原和识别抗体,通过聚类竞争加速克隆扩增,提高抗体成熟力及亲和性,增强候选模式支持度。实验及应用表明,该算法加快了关联规则挖掘的收敛速度,具有更强的全局与局部搜索能力,提高了所得关联规则的准确率。  相似文献   

14.
关联规则挖掘中Apriori算法的研究与改进   总被引:5,自引:0,他引:5  
崔贯勋  李梁  王柯柯  苟光磊  邹航 《计算机应用》2010,30(11):2952-2955
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。  相似文献   

15.
本文采用一种基于布尔矩阵的频繁集挖掘算法。该算法直接通过支持矩阵行向量的按位与运算来找出频繁集,而不需要Apriori算法的连接和剪枝,通过不断压缩支持矩阵,不仅节约了存储空间,还提高了算法的效率。  相似文献   

16.
一种基于事务压缩的关联规则优化算法   总被引:10,自引:0,他引:10  
通过对Apriori算法挖掘过程进行分析,提出了一种基于事务压缩的关联规则挖掘算法.该算法充分利用Apriori性质,通过减少候选集的组合和减少数据库的扫描来提高挖掘的速度和减少数据库的I/O操作时间的开销,有效提高了关联规则的挖掘效率.并在Apriori算法的基础上设计了Apriori改进算法.  相似文献   

17.
基于GEP的多层关联规则挖掘算法及其应用   总被引:1,自引:1,他引:0  
为了在Web使用挖掘中挖掘网站服务器日志数据库的热点Web页面访问集及发现其关联规则,提出了一种新的基于GEP(gene expression programming,基因表达式编程)的适用于挖掘多层关联规则的算法.将泛化技术应用于GEP作为它的适应性函数度量,引入GEP强大的自搜索功能,进化到较优的种群后,再利用传统的支持度一置信度的方法在子数据库的多个层及层间挖掘频繁项及关联规则.该算法改进了传统多层关联规则挖掘框架,实验结果表明了该算法在大数据库中的有效性和高效性.  相似文献   

18.
数据挖掘的一个重要任务便是从数据库中挖掘出有趣的关联规则。传统的关联规则挖掘方法一般基于支持度-置信度体系,时常会挖掘出虚假规则或忽略掉有用的规则。针对这一问题,本文借鉴对照实验的思想,提出基于T统计量的关联规则挖掘方法,用显著度代替置信度,使挖掘出的规则更具有统计显著性。算例分析和数据实验表明,这种方法可以解决传统关联规则方法存在的上述问题,提高关联规则的有效性。  相似文献   

19.
关联规则的挖掘是数据挖掘研究中的一个重要课题,目前已经提出了许多用于发现海量事务库中关联规则的算法以及更新已经发现的关联规则的算法。但是在关联规则的更新算法中,都是基于支持度变化和事务库变化的研究,目前没有人研究当事务库中的属性发生变化时,如何高效地更新关联规则的问题。针对这种情况,提出了三种基于属性变化的增量关联规则挖掘算法ACA+(Attribute Change Algorithm)和ACA-(ACA1-),从而解决了该问题。  相似文献   

20.
挖掘时间序列motif间潜在的关联规则可以在预测未来趋势方面发挥重要作用,时间序列motif即时间序列中先前未知的重复出现的模式。针对符号化时间序列提取motif导致信息丢失的问题,提出基于剪枝技术的motif提取算法PM_Motif,实现了保留原始信息的motif的精准快速提取;针对分割motif来发现其内部关联规则导致的规则不一致的问题,从motif间的关联规则入手,给出了基于AR_TSM方法的时间序列motif关联规则挖掘算法,从根本上避免了因motif分割引起的不确定性,保证了规则的一致性;最后,引入了关联规则评价参数RM,在多数据集上证明了关联规则的预测性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号