共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
基于向量内积的关联规则挖掘算法研究 总被引:5,自引:1,他引:5
针对近年来研究较多的数据关联挖掘问题,论文将向量内积引入到该领域,并通过合理分配数据存储结构来提高数据库频繁项集的生成效率。研究表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有动态剪枝、不保存中间候选项和节省大量内存空间等优点。在处理超大型数据库和分布式数据库方面均能得到较好的应用。 相似文献
3.
基于改进Apriori算法的关联规则挖掘研究 总被引:2,自引:2,他引:2
关联规则挖掘研究是数据挖掘研究的一项重要的内容。经典的关联规则提取算法——Apriori算法及其改进算法存在着一些不足,一是会产生大量的候选项目集,二是在扫描数据库时需要很大的I/O负载。通过对关联规则产生过程的实际实验分析发现,可以采取利用频繁k-1项集Lk-1对候选k项集Ck进行预先剪枝、及在扫描数据库过程中忽略对频繁项集的产生无贡献的交易记录的方法来改进关联规则提取的效率。 相似文献
4.
朱喜梅 《数字社区&智能家居》2006,(2):36-37
关联规则挖掘则是数据挖掘中最重要的分支之一。它着重研究大量数据中项集之间有趣的关联或相关关系,一个典型的例子就是购物篮分析。该过程可以分析出哪些商品顾客倾向于在一起购买,从而可以为商店经理提供比较好的商店布局方式。例如,通过分析,我们发现,顾客在购买了一台计算机以后,一般都会去购买财务管理软件,那么我们就可以把计算机和财务管理软件放在比较近的位置,以增加销售量。这里主要介绍了关联规则挖掘的经典算法,Apriori算法,同时给出了关联规则中的基本概念,然后分析了算法的运行效率。提出了改进的方法。 相似文献
5.
基于属性分组的高效挖掘关联规则算法 总被引:6,自引:0,他引:6
挖掘频繁项集在数据挖掘中有着重要的作用。目前,关于频繁项集的挖掘问题已经提出了一些算法,虽然实现了一次扫描数据库即可以发现所有的频繁项集,但是当属性数目很多时,算法的执行效率下降很快。论文首次提出了利用属性分组作为挖掘关联规则的工具,给出了基于属性分组的频繁项集挖掘算法,用矩阵来存储数据库属性间的信息并提取频繁项集,而且不产生候选项集。经实验验证该算法是快速有效的。 相似文献
6.
7.
目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,但都是对关联规则中满足最小支持度的频繁项集的研究,没有对频繁项集中如何高效地计算得到满足最小置信度的关联规则进行研究.针对这种情况,提出了一种高效关联规则的挖掘算法EA,解决了在挖掘关联规则过程中如何高效挖掘满足最小置信度的关联规则问题. 相似文献
8.
9.
挖掘关联规则中Apriori算法的研究与改进 总被引:10,自引:5,他引:10
关联规则是数据挖掘中重要的研究课题。对关联规则挖掘算法Apriori算法的关键思想以及性能进行了研究,指出该算法的某些不足,并且提出了一种产生候选项集的新算法。该算法提高了原算法的效率。 相似文献
10.
挖掘关联规则中Apriori算法的研究与改进 总被引:17,自引:0,他引:17
关联规则是数据挖掘中重要的研究课题。对关联规则挖掘算法Apriori算法的关键思想以及性能进行了研究,指出该算法的某些不足,并且提出了一种产生候选项集的新算法。该算法提高了原算法的效率。 相似文献
11.
本文采用一种基于布尔矩阵的频繁集挖掘算法。该算法直接通过支持矩阵行向量的按位与运算来找出频繁集,而不需要Apriori算法的连接和剪枝,通过不断压缩支持矩阵,不仅节约了存储空间,还提高了算法的效率。 相似文献
12.
一种基于Apriori的动态关联规则挖掘方法 总被引:2,自引:0,他引:2
文章介绍了一种动态关联规则的挖掘方法,该方法的核心思想是仅使用更新的事务和前面阶段的挖掘结果,用Apriori类算法作为局部过程来产生频集,并给出了具体的动态挖掘算法。 相似文献
13.
王平水 《计算机工程与应用》2010,46(30):115-116
关联规则挖掘是数据挖掘的一个重要研究领域。针对经典Apriori算法频繁扫描事务数据库致使运行效率低下的缺点,在研究已有关联规则挖掘算法的基础上,提出一种改进的基于关系矩阵的关联规则挖掘算法。理论分析和实验结果均表明,所提算法是高效的和实用的。 相似文献
14.
基于传感器网络的K-均值聚类算法研究 总被引:1,自引:0,他引:1
现有的传感器网络数据处理系统只能向用户提供简单的查询操作,如何高效地处理传感器网络的海量数据流,从中获取有用的知识成为新的挑战.提出了一种基于传感器网络的分布式K一均值聚类算法,首先由中心点下发k个质心的初始值,各个节点将数据对象赋于质心距离最近的簇,并将簇的信息通过传感器网络逐层上传合并;然后中心点计算k个簇中对象的平均值,再下发,反复迭代,直到各个簇满足误差准则,得到最后的聚类结果.实验证明,该算法准确率较高,计算时间较短. 相似文献
15.
基于频繁模式树的分布式关联规则挖掘算法 总被引:1,自引:0,他引:1
提出一种基于频繁模式树的分布式关联规则挖掘算法(DMARF).DMARF算法设置了中心结点,利用局部频繁模式树让各计算机结点快速获取局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.DMARF算法采用顶部和底部策略,能大幅减少候选项集,降低通信量.理论分析和实验结果均表明了DMARF算法是快速而有效的. 相似文献
16.
基于关系数据库的关联规则的形式化开采 总被引:1,自引:0,他引:1
从研究关联规则概念入手,探讨了项目、项目集合和交易数据库等概念在关系数据库中的具体含义,提出了一种全面的、易于理解和使用的关联规则形式化描述方法,并给出了开采关系型数据库中关联规则的一般过程,这为关系型数据库中关联规则开采系统的设计奠定了基础,对系统设计者有一定的指导意义。 相似文献
17.
针对Apriori寻找频繁项集问题,提出了基于垂直事务列表的树形结构的挖掘算法。该算法结合项集的有序特性,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且能保持频繁项集的完整性,从而节约了计算开销,提高了算法的效率。 相似文献
18.
关联规则是数据挖掘的重要研究内容之一。针对数据库数据增加的同时最小支持度发生改变的关联规则更新维护问题,提出了一种基于矩阵的增量式关联规则挖掘算法IUBM。该算法采用简单的数组和位运算,在执行关联规则的更新时,既不用多次扫描数据库,也不产生庞大的候选项集。实例表明,该算法的时间复杂度和空间复杂度大大降低。 相似文献
19.
关联规则挖掘技术研究进展* 总被引:3,自引:2,他引:3
为帮助人们深入研究关联规则挖掘技术,总结了关联规则的分类方法、评价方法以及相关技术的最新进展,特别是对关联规则的主要算法进行了详细的介绍,并探讨未来的发展方向。该研究比较系统全面,对将来进一步深入分析关联规则挖掘技术具有指导意义。 相似文献
20.
关联规则挖掘中对Apriori算法的一种改进研究 总被引:24,自引:0,他引:24
针对Apriori算法寻找频繁项集问题,通过对事务数据库的布尔化表示,提出了一种直接利用布尔矩阵的行向量去搜寻频繁项集的思想。即通过向量的内积运算和判别准则逐步浓缩布尔矩阵的行向量,从而快速、直观地归纳出事务数据库的频繁项集。研究和分析表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有搜索速度快、节省内存空间和处理项目集维数大等优点。对于处理超大型事务数据库和分布式事务数据库,同样也有较好的应用。 相似文献