首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 49 毫秒
1.
Apriori算法是经典的关联规则挖掘算法之一。该算法可以很好地挖掘关联规则,通过连接步和剪枝步从频繁项集中获取候选项集,但产生大量的候选项集,这就需要重复扫描数据库,大大增加算法运行时间。文中提出一种基于矩阵的改进算法,通过事务矩阵和候选项集项目矩阵相乘的矩阵操作来改进频繁扫描数据库的问题。事务数组的建立可以删除不能生成下一频繁项集的事务,删除不必要的项,针对频繁项集的产生过程优化Apriori算法的连接步和修剪步。在不同的数据集下通过实验验证改进算法不仅能准确地挖掘出频繁项集而且大大地缩短挖掘时间。  相似文献   

2.
加权最大频繁项目集挖掘算法   总被引:2,自引:0,他引:2  
关联规则是数据挖掘领域的一个重要分支,而发现最大频繁项目集是关联规则挖掘中的重要问题.最大频繁项目集挖掘是在数据库中各属性之间是平等的情况下进行的,但现实中并非如此.频繁模式树(Frequent Pattern Tree,FP-Tree)已不能满足要求.为此提出了一个有效的基于加权FP-Tree的加权最大频繁项目集挖掘算法,其挖掘过程中不需要产生候选项目集.并通过实例说明了此算法的挖掘过程.实验结果表明此算法是有效的并且有较好的扩展性.  相似文献   

3.
提出一种新的基于PR(Probability Ratio,简称PR)模型的教育信息化数据矩阵加权正负关联模式挖掘算法.算法从教育信息化数据中挖掘矩阵加权频繁项集和负项集,采用PR模型作为正负关联模式评价标准,对频繁项集和负项集挖掘教育数据矩阵加权正负关联模式,发现有趣的教育信息矩阵加权正负关联模式.通过模式分析,发现教育领域信息化数据中潜在的、有用的教育信息、教学规律和教育发展趋势.以真实的教育信息化数据作为实验数据,实验结果表明,该算法更有效、合理.  相似文献   

4.
吴六爱  刘应东 《信息技术》2011,(11):16-18,23
高效地找出所有的频繁项集是关联规则挖掘中的核心问题。通过对已有的基于矩阵的频繁项集挖掘算法的研究,提出一种基于团的频繁项集快速生成算法。该算法采用关联图存储频繁两项集信息,找关联图中团,逐步减少团中项来搜索所有最大频繁项集,并且其扫描数据库仅需一次。通过使用标准数据集进行验证测试并与其他算法进行比较,实验结果表明,该算法具有较快的挖掘速度。  相似文献   

5.
随着信息技术和数据库技术的飞速发展,从大量的数据中获取有用的信息和知识变得越来越重要。模糊关联规则挖掘是数据挖掘中针对数量型属性关联规则发现的一种有效方法。提出了一种基于矩阵的模糊关联规则挖掘算法,并将其应用于网络安全事件关联分析中,通过对DARPA标准数据集的分析,得出了预期数量的关联规则,并成功验证了某些攻击场景,该模糊关联规则挖掘算法取得了较好的实验结果。  相似文献   

6.
关联规则的研究是数据挖掘中的重要问题,如何高效地发现频繁项集是关联规则研究中的关键问题.根据数据库事务的统计性规律,在最大频繁项集发现算法Apriori及其变种算法的基础上,提出一种新的基于层次的最大频繁项集的发现算法.首先从整体上判断候选集的频繁性,然后在发现最大频繁项集的过程中,通过引入整体性策略、排序策略、最小策略有效地减少了候选集与数据库事务之间的比较次数.实验结果表明,采用该算法处理数据库事务数量大的最大频繁项集的发现任务,其效率相比Apriori算法有显著的提高.  相似文献   

7.
关联规则的开采是数据挖掘中的一个重要问题,其核心是频繁模式挖掘。频繁模式挖掘算法的高效率性近年来是许多学者研究的方向。首先对关联规则挖掘问题进行了描述,其次对一种基于项目可辨识向量及其“与”运算设计的频繁项集快速挖掘算法SLIG进行了分析,最后利用二元关系矩阵及其项之间的二元关系数目,缩减候选频繁k项集的产生,提出了改进算法SLIG*,提高了SLIG算法的效率。  相似文献   

8.
频繁项集快速挖掘及更新算法   总被引:2,自引:0,他引:2  
为了克服Apriori发现频繁项集存在的问题,提出了一种基于三维项集矩阵和向量(TIMV)的频繁项集挖掘算法.该算法摆脱了Apriori框架的束缚,仅需扫描数据库一次,不产生候选项目集.当事务数据库和最小支持度发生变化时,该算法只需重新遍历一次项集矩阵,即可得到新的频繁项集.实验结果表明,算法能有效提高频繁项目集的挖掘和更新效率.  相似文献   

9.
引入一种新的加权关联规则支持度和置信度的计算方法,并利用矩阵的存储结构提出一种新的加权关联规则挖掘算法,从而改进了加权频繁项集的挖掘效率.该算法在Apriori算法的基础上,对数据库仅需扫描一次,能很快地计算项集的支持度,大大减少了I/O次数,有效提高了加权频繁项集的生成效率.通过应用于超市捆绑销售,证明了该算法能有效地提取商品间的关联信息,有助于商品的销售.  相似文献   

10.
关联规则的研究是数据挖掘中的重要问题,如何高效地发现频繁项集是关联规则研究中的关键问题。根据数据库事务的统计性规律,在最大频繁项集发现算法Apriori及其变种算法的基础上,提出一种新的基于层次的最大频繁项集的发现算法。首先从整体上判断候选集的频繁性,然后在发现最大频繁项集的过程中,通过引入整体性策略、排序策略、最小策略有效地减少了候选集与数据库事务之间的比较次数。实验结果表明,采用该算法处理数据库事务数量大的最大频繁项集的发现任务.其效率相比Aoriori算法有显著的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号