首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
相联规则模型可以用于在海量数据库中发现有价值的知识 ,各种求解相联规则的算法都需要较大的计算量 .随着时间推移 ,数据库中的数据也随之发生变化 .由于原先发现的规则已经过时 ,需要重新在数据集中挖掘规则 .本文通过向数据库中不追加数据的方法研究孕育在数据库中的相联规则变化情况 .在借鉴 FUP等算法的基础上 ,充分利用前次挖掘中获得的有关信息 ,提出用于再次挖掘的相联规则增量算法 Super FU P.该算法核心思想是更多地注重新增数据集 ,有效利用前次挖掘信息 ,仅仅对整个数据库扫描一次就能达到求解更新相联规则的目的 ,提高了相联规则增量算法的效率 .  相似文献   

2.
约束性相联规则发现方法及算法   总被引:47,自引:0,他引:47  
文中研究了在大型事务7库中发现有约束条件的相联规则问题,提出了有效实现约束性相联规则发现的两种方法,过滤数据库算法Filtering和频繁项集生成算法Separate,这两种可以同时并有物方法比已有算法运算效率有显著性提高。  相似文献   

3.
一种增量式规则提取算法   总被引:6,自引:0,他引:6  
扩展了决策矩阵的定义,并在此基础上提出一种增量式规则提取算法(IREA),该算法能够以增量的方式从样本数据中提取确定性和可能性规则.对于缺乏领域知识时的知识/规则获取具有重要使用价值.  相似文献   

4.
一种改进的关联规则提取算法   总被引:1,自引:0,他引:1  
运用图论中的完全图知识,对关联规则提取过程的第一阶段进行改造,把大项集计算转换为集合的并和交两种基本运算,并利用候选大项集生成过程中的中间结果对已知大项集进行过滤,大大减少不必要的重复计算,从而加快候选大项集的生成速度.  相似文献   

5.
一种新的普遍化关联规则挖掘算法   总被引:1,自引:0,他引:1  
提出了一种新颖的普遍化关联规则挖掘算法GARL。该算法连续扫描数据库事务序列,在最多不超过两遍扫描后生成所有频繁项目集,在首次扫描数据库时,能为用户给出反馈信息,允许用户对最小支持率进行调整,该算法能连续处理事务序列,可用于网上在线数据挖掘。  相似文献   

6.
相联规则发现的一般性算法研究   总被引:4,自引:0,他引:4  
大型事务数据库中相联规则的发现是KDD中一个很重要的问题。本文描述了相联规则发现的一般性算法,对其核心问题进行了全面和较深入的探讨,并提出了一些提高算法效率的方法。  相似文献   

7.
在研究多段支持度数据挖掘算法的基础上提出并行挖掘相联规则的算法。给出了在并行条件下以负载平衡为目的的种子项集的划分的贪心算法策略。基于多段支持度特征,为减少各个处理机之间的制约,提出按事务长度进行数据集划分的方案,并具体实现了多段支持度的并行算法。实验结果表明该算法具有很高的效率,特别是在双CPU情况下,并行算法的效率接近顺序算法的两倍,如果把算法修正和推广到群集环境下,会更一步增加相联规则的实用性。  相似文献   

8.
大型事务数据库中的一种快速的规则挖掘算法   总被引:1,自引:0,他引:1  
1 引言数据挖掘(Data Mining),也称为数据库中知识发现KDD,是指发掘隐藏在堆积如山的数据中的真知灼见,这基本上正在变成一种商业上非做不可的事情。关联规则(As-sociation Rules)是数据挖掘的重要研究内容,目前的绝大部分关联规则挖掘算法一般都分为两个阶段:①频繁项目集的发现;②规则的产生。算法的计算工作量主要集中在第一阶段上,因此,如何快速确定频繁项目集是算法效率的关键,在这方面已有许多工作与成果。但总的来讲,许多研究都是在Apriori算法或其派生算法的基础上进行的。这些算法或多或少存在如下两个问题:①算法必须耗费大量的时间处理规模巨大的候选项目集;②算法必须多次重复机械地扫描  相似文献   

9.
基于项目属性的相联规则提取   总被引:2,自引:0,他引:2  
相联规则是数据库知识发现领域的重要方法之一,用于发现满足用户指定最小支持度和最小信任度阈值的规则,其中,最小支持度阈值确定了研究数据集的规模,最小信任度阈值用来衡量一个规则可靠性,在通常的支持度/信任度框架下,用户只能给出一对最小支持度和最小信任度阈值,因此,对于有数据项均采用统一标准处理,但是,实际数据库中的数据项目具有自的特点,该文旨在根据项目的属性特征,通过模糊安全评判,决定项目合理的最小支持度阈值,进而确定各个项目的支持度区间,达到在一次数据挖掘中同时发现频繁规则和稀有规则的,由于基于最小信任度的规则提取具有冗余性,文中提出规则前件和后件的重要程度对比的思想,借助主观判断去除冗余规则,从而挖掘出尽可能接近自然的完全规则。  相似文献   

10.
挖掘转移规则:一种新的数据挖掘技术   总被引:7,自引:0,他引:7  
文中提出一种新的数据挖掘技术;挖掘转移规划。  相似文献   

11.
一种新的关联规则发现算法及应用研究   总被引:3,自引:0,他引:3  
文章对关联规则发现中应用较多的Apriori算法和DHP算法进行了分析,提出了一种新的关联规则发现算法。为了计算项目集的支持度,提出了数据库特征矩阵和特征矢量的概念。该算法通过对特征矢量求内积得出项目集(item-set)的支持度,只需遍历数据库一次,大大减少了对数据库的操作,提高了算法的效率。算法分析和实例证明验证了算法的快速性和高效性。  相似文献   

12.
改进频繁项集算法的效率是提高关联规则挖掘性能的重要环节,本文提出了基于包含频繁1-项集的事务集的关联规则挖掘算法,并通过实例说明了算法的有效性,且与Apriori这一经典算法作了比较。  相似文献   

13.
改进频繁项集算法的效率是提高关联规则挖掘性能的重要环节.本文提出了基于包含频繁1-项集的事务集的关联规则挖掘算法,并通过实例说明了算法的有效性,且与Apriori这一经典算法作了比较。  相似文献   

14.
对挖掘关联规则的Apriori算法关键思想进行了研究,给出该算法的一个改进算法,提高了原算法的性能。  相似文献   

15.
Apriori算法是关联规则的经典算法,并己经被越来越多的企业使用。它在给企业带来经济效益的同时,也让人们意识到算法自身的不足:第一,该算法在扫描事务数据库的次数过多,从而需要承担很大的I/O负载;第二,它可能产生庞大的候选集。为了提高Apriori算法的效率,针对减少扫描事务数据库次数的方法,提出一种改进挖掘效率的算法。  相似文献   

16.
关联规则提取中对Apriori算法的一种改进   总被引:25,自引:0,他引:25  
关联规则的提取是数据挖掘中的重要研究课题,该文对关联规则提取中的Apriori算法进行了深入研究,指出了该算法的某些不足,提出了一种改进算法。实验结果表明,该算法性能明显优于Apriori算法,具有较高的推广价值。  相似文献   

17.
陈涛  张玮 《微机发展》2007,17(1):139-141
在研究关联规则挖掘算法的基础上,对并行关联规则算法进行了比较全面的分析,并给出了并行数据挖掘的计算框架。提出了一个以计算服务器为中心节点的并行挖掘算法,可以发挥各局部节点的优势,无需各局部节点进行通信,减少了各局部节点的通信负荷。通过理论分析和实验数据验证,该算法具有较好的可扩展性和海量处理能力,特别是在节点数目较多的情况下更显示出优势。  相似文献   

18.
一种基于图的关联规则挖掘改进算法   总被引:3,自引:0,他引:3       下载免费PDF全文
本文提出了一种基于图的关联规则挖掘的改进算法。首先介绍了基于图的关联规则挖掘算法;然后,在此基础上对原算法进行了修改,通过在图中查找完全子图来寻找频繁项集;最后,对原算法、改进算法和Apriori算法的优缺点进行了简单的比较分析。  相似文献   

19.
张素文  孟建良等 《微机发展》2003,13(4):64-66,70
从实际应用角度,在对模糊关联规则挖掘算法进行改进的基础上,提出了模糊关联规则的加权挖掘算法(FARMA),以及简化的关联规则的加权挖掘算法(SFARMA),通过实验验证了算法的可行性,并对算法的性能进行了讨论。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号