共查询到20条相似文献,搜索用时 46 毫秒
1.
一种新的关联规则增量式更新算法 总被引:8,自引:0,他引:8
首先提出了一个新的概念-后备频繁项目集,其次给出了一种新的增量式更新算法NEWFUP,最后介绍了在某中小型商业企业的事务数据库中该算法的实现。 相似文献
2.
基于项目序列集操作的关联规则挖掘算法 总被引:29,自引:0,他引:29
最大频繁项目序列集的生成是影响关联规则挖掘的关键问题,传统的算法是通过对事务数据库的多次扫描实现的,最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的I/O代价来获得更高的效率,随着计算机性能的提高,探索合适的数据结构来支持基于一次事务数据库扫描的高效算法成为可能,该文首先给出项目序列集和它的基本操作的严格定义,然后在此基础上提出了一个称为ISS-DM的最大频繁项目序列集生成算法。ISS-DM算法是通过对事务数据库的一次扫描而逐步演化成最大频繁项目序列集的,最后作者对这一算法的时间和空间效率进行了理论分析和实验验证。 相似文献
3.
一种高效的关联规则挖掘算法研究 总被引:2,自引:1,他引:2
一般关联规则挖掘算法分为两步:第一步是发现频繁项目集;第二步是利用频繁项目集产生关联规则。文章讨论了现今关联规则挖掘算法的特点和不足,同时提出一种效率更高的挖掘算法。与其它算法不同的是,该算法侧重于知识领域的使用和关联规则系统应用的预备。 相似文献
4.
本文就最小支持度和最小置信度不变而数据库中增加数据记录时,关联规则的维护问题进行研究,提出了一种新的关联规则维护算法,该算法只需扫描一遍数据库。 相似文献
5.
6.
在支持度不变的情况下,如何从已更新的数据库中高效的挖掘关联规则?本文在分析了已有的诸关联规则挖掘与更新算法的基础上,提出了一种新关联规则更新算法,该算法仅需扫描数据库一次,即可得到关联规则,从而使算法的效率得到提高。 相似文献
7.
8.
基于最近挖掘结果的关联规则更新算法 总被引:3,自引:0,他引:3
Apriori算法是著名的关联规则挖掘算法,它必须对数据库进行多次遍历,针对关联规则的维护问题,提出利用最近一次关联规则的挖掘结果进行更新的算法,仅需对数据库进行两次遍历,提高了关联规则的更新效率。 相似文献
9.
对关联规则的挖掘是数据挖掘中的一个重要问题。在挖掘之前先对数据库扫描,以获得一些辅助的信息,能极大地加速挖掘过程。ARSC算法以建立一种称为分段信息表的数据结构来提高关联规则挖掘的效率。分段信息表所占用的空间很小,生成所需要的时间也很短,却能够获得很好的性能。它还有很强的通用性,能在多种数据挖掘任务和多种算
算法中使用。 相似文献
算法中使用。 相似文献
10.
关联规则的发现是数据挖掘中的一个重要问题,本文在经典关联规则的基础上提出了关联规则的扩展模型。并给予了算法的讨论。 相似文献
11.
在阐述了关联规则算法Apriori要义的基础上,解读了其在Weka系统中的具体实现。详细分析了weka源代码中实现Apriori算法的基础核心类包和算法实现类包中的关键类以及这些类内部的关键函数及变量,为探索通过weka源代码学习和研究数据挖掘算法及其实现方法提供了很好的帮助。 相似文献
12.
针对关联规则数量巨大并且存在极大冗余的问题,提出无冗余告警关联规则产生算法。从规则本身的关联性和等效性上定义规则的冗余性,通过构造频繁闭项集邻接图发现无冗余告警关联规则,用户可以通过发现的规则推导出其余所有冗余规则,并且得到用户所需的规则形式。该方法不仅能够减少关联规则数量,而且不会带来规则丢失。仿真结果表明,在相同的数据集、最小支持度门限和最小置信度门限条件下,无冗余关联规则数量和产生时间都小于冗余关联规则数量和产生时间,支持度门限越小,差距越显著。 相似文献
13.
Attribute Generation Based on Association Rules 总被引:1,自引:0,他引:1
Masahiro Terabe Takashi Washio Hiroshi Motoda Osamu Katai Tetsuo Sawaragi 《Knowledge and Information Systems》2002,4(3):329-349
A decision tree is considered to be appropriate (1) if the tree can classify the unseen data accurately, and (2) if the size
of the tree is small. One of the approaches to induce such a good decision tree is to add new attributes and their values
to enhance the expressiveness of the training data at the data pre-processing stage. There are many existing methods for attribute
extraction and construction, but constructing new attributes is still an art. These methods are very time consuming, and some
of them need a priori knowledge of the data domain. They are not suitable for data mining dealing with large volumes of data.
We propose a novel approach that the knowledge on attributes relevant to the class is extracted as association rules from
the training data. The new attributes and the values are generated from the association rules among the originally given attributes.
We elaborate on the method and investigate its feature. The effectiveness of our approach is demonstrated through some experiments.
Received 6 December 1999 / Revised 28 October 2000 / Accepted in revised form 9 March 2001 相似文献
14.
15.
现有的数据挖掘算法多是集中式环境下的数据挖掘处理,但目前的大型数据库多以分布式的形式存在,针对分布式数据挖掘算法FDM及其改进算法中存在的频繁项集丢失问题和网络通信开销过高的问题,提出了一种改进的基于关联规则的分布式数据挖掘算法LTDM,LTDM算法引入了映射标示数组机制,可以在保证频繁项集完整性的同时降低网络的通信开销。实验结果证明了算法的有效性。 相似文献
16.
17.
18.
19.
挖掘关联规则算法的优化处理 总被引:9,自引:0,他引:9
在挖掘关联规则的执行过程中,早期循环生成最大项目集的过程是很重要的。文中提出基于哈希表的算法,对生成侯选项目集的过程进行了优化,尤其是对生成二维侯选项目集更是有效。由于在早期循环中,生成侯选项目集的势较小,使得能更有效地修剪数据库,从而减小了后期循环的计算代价,同时也减小了I/O请求。 相似文献
20.
在研究多段支持度数据挖掘算法的基础上提出并行挖掘相联规则的算法。给出了在并行条件下以负载平衡为目的的种子项集的划分的贪心算法策略。基于多段支持度特征,为减少各个处理机之间的制约,提出按事务长度进行数据集划分的方案,并具体实现了多段支持度的并行算法。实验结果表明该算法具有很高的效率,特别是在双CPU情况下,并行算法的效率接近顺序算法的两倍,如果把算法修正和推广到群集环境下,会更一步增加相联规则的实用性。 相似文献