首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
关联规则挖掘中最大频繁集的双向查找算法   总被引:5,自引:0,他引:5  
在事务数据库中挖掘关联规则已成为数据挖掘领域的一个重要研究课题,而其中频繁项集的查找时间是影响挖掘效率的关键因素。基于Apriori算法,根据最大频繁集的双向查找算法,提出了算法的实现步骤,让两个方向的剪枝工作实现信息共享,加快最大频繁集的查找速度,节省I/O操作时间,并且通过实例和仿真实验验证了算法的高效性。  相似文献   

2.
关联规则是当前数据挖掘研究最重要的分支之一,目前的关联规则多是在频繁项集的基础上进行挖掘,而没有挖掘非频繁项集的算法。本文在多支持度算法的基础上,提出了一种新的算法模型,在挖掘频繁项集的同时还能够对非频繁项集进行挖掘。  相似文献   

3.
针对传统的关联规则数据挖掘的支持度-置信度框架存在很多缺陷,同时研究正负关联规则时可能产生很多问题的情况,阐述了在正负关联规则挖掘中,如何利用允许用户指定多重最小支持度来反应数据库中项的性质和它们各种各样的频率,并通过设置相关度提高挖掘效率.实验结果显示该方法是有效的.  相似文献   

4.
为了进一步提高频繁项集挖掘算法的可扩展性,对频繁项集的搜索空间以及FP-tree的操作方法进行了研究.提出了通过FP-tree的操作实现频繁项集快速挖掘的相关性质和新的搜索策略,在此基础上提出了基于FP-tree的频繁项集挖掘的改进算法.算法运用递增构建候选项集模式树的策略缩小搜索空间,运用FP-tree的部分遍历操作简化搜索过程.在多个标准测试数据集上的实验结果表明,该算法的执行时间比同类算法减少了一个数量级,且占用较少的内存空间,因此该算法对于提高频繁项集和频繁闭项集的挖掘效率具有明显的效果.  相似文献   

5.
关联规则挖掘的一种改进算法   总被引:4,自引:0,他引:4  
关联规则挖掘是数据挖掘中重要的研究课题,R.Agrawal和R.Srikant于1994年提出的Apriori算法是关联规则挖掘的最有影响的算法,针对Apriori算法中频繁项集产生效率低这个核心问题,本文给出分辨矩阵、分辨向量并提出基于分辨矩阵的改进算法,它能有效提高频繁集的产生效率.  相似文献   

6.
一种改进的关联规则挖掘算法   总被引:2,自引:0,他引:2  
本文在Aprioi算法的基础上,引入了临时数据库及多支持度,使交易数据库的规模不断缩小,同时又灵活控制了各频繁项集产生的数量,结果表明该算法对关联规则挖掘较为有效。  相似文献   

7.
目前负关联规则研究的主要形式是左右两边项集全正或者全负,如(a1a2)■┐(b1b2)、┐(a1a2)#(b1b2),但有时形如a1┐a2■b1┐b2的负关联规则能够提供更多的决策信息,然而要挖掘这样的负关联规则需要先挖掘形如a1┐a2■b1┐b2的负频繁项集。为此,本文提出了一个有效的方法来挖掘这样的负频繁项集。该方法包含一个有效的负候选项集生成算法,和仅利用正频繁项集有关信息来计算负候选项集支持度的方法,而不用再次扫描数据库。实验表明了提出方法的有效性。  相似文献   

8.
由频繁项集产生的关联规则往往不能保证规则前、后件中的项是正相关的,因此可能产生无意义的关联规则;当这些关联规则用于分类时,会产生大量无用分类规则,增加了时间开销.因此,基于数学期望提出了正相关的频繁项集的分类算法.该算法在挖掘正相关频繁项集时,利用置信度进行规则选取,生成正相关关联规则组成的分类器对数据集进行分类.实验表明,这种分类算法可以大幅度减少所产生的频繁项集数量,分类准确率达到C4.5和CMAR的水平,且显著减少了算法的时间.  相似文献   

9.
分类和关联规则是数据挖掘领域中最流行的两种技术。文章在分析Apriori关联规则算法的原理的基础上,对分类与Apriori两种技术的不同特点进行了比较。根据不同点将Apriori算法作为核心技术引入到分类挖掘中,给出一个新的分类算法,从实例的结果可以知道该算法的正确性和有效性,尤其是它能够很容易的处理带有缺省属性值的记录。  相似文献   

10.
关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集.Apriori算法是频繁项集挖掘的有效算法.在Apriori的算法中,采用哈希树存储平凡项集的候补项集以便快速计算其支持度.本文在分析算法所存在的效率瓶颈的基础上,提出了一个有效的改进算法,通过利用一维数组替代算法中复杂的哈希树...  相似文献   

11.
研究了计算机动态取证的相关技术,提出了一个计算机动态取证系统模型并对相关模块进行设计。根据动态取证的特点.将数据挖掘技术和多智能代理技术结合起来应用于动态取证系统中。系统在体系结构上使用基于智能代理的分布式结构,采用数据挖掘技术进行动态取证的海量数据分析,针对基本挖掘算法在取证分析实际应用中可能存在的不足,提出了相应的改进方法,通过实验分析,证明了改进算法在动态取证应用中的有效性。  相似文献   

12.
研究了计算机动态取证的相关技术,提出了一个计算机动态取证系统模型并对相关模块进行设计。根据动态取证的特点,将数据挖掘技术和多智能代理技术结合起来应用于动态取证系统中,系统在体系结构上使用基于智能代理的分布式结构,采用数据挖掘技术进行动态取证的海量数据分析,针对基本挖掘算法在取证分析实际应用中可能存在的不足,提出了相应的改进方法,通过实验分析,证明了改进算法在动态取证应用中的有效性。  相似文献   

13.
文章利用数据挖掘技术分析了计算机数学课程能力的培养。首先建立学生成绩的数据仓库,利用数据挖掘技术中对比概念描述方法对历年不同专业和不同性别学生进行各种能力分析,并提出了相应的教学内容和教学方法的改革措施。  相似文献   

14.
基于空间数据仓库的空间数据挖掘研究   总被引:2,自引:0,他引:2  
在讨论空间数据挖掘的相关技术对空间数据挖掘影响的基础上 ,提出一个基于空间数据仓库的空间数据挖掘模型 ,从基于空间数据仓库的数据挖掘角度出发 ,提出有待深入研究和探索的问题 .  相似文献   

15.
随着Internet的迅速发展,使得“数据丰富而信息贫乏”这对矛盾显得日益突出,数据挖掘技术正是应了这一需求而结合了机器学习、模式识别、统计学、人工智能、神经网络等多学科而出现的一项新技术,基于Web的数据挖掘是数据挖掘技术在网络信息处理中的应用。本文叙述了Web数据挖掘的概念、分类、技术等,重点讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

16.
粗糙集理论在分类的意义下定义了模糊性和不确定性的概念,是一种处理不确定和不精确问题的新型数学工具,文中以实例介绍了粗糙集的基本理论,并通过一个实例详细介绍了在基于对决策表属性约简的基础上采用了可变精度粗糙模型实现规则的获取. 该实例说明了基于粗糙集进行规则的挖掘是有效的.  相似文献   

17.
利用数据挖掘技术,通过对历史数据的分析预测下一个时间间隔的交通流状况,可以为交通流诱导和信息发布打下基础;通过对路口流量历史数据的聚类分析可得出单路口TOD控制算法的最优时段分段和各时段中的最优控制参数,从而优化单路口控制算法的控制效果;通过对路段流量历史数据之间的关联分析,可得出路段之间的关联规则,从而可以由一个路段的流量推断其关联路段的流量,为实时交通流诱导和信息发布提供实时依据。  相似文献   

18.
提出了一种基于数据挖掘技术的入侵检测系统模型,该模型是一个核模型,具有很好的扩展能力和适应能力.结合异常检测和误用检测方法,提出了一种改进型的基于数据挖掘的入侵检测系统.论述了数据挖掘技术在入侵检测系统中的应用,讨论了数据预处理和特征提取问题.  相似文献   

19.
基于FP-tree的快速数据挖掘算法   总被引:1,自引:0,他引:1  
针对挖掘全局频繁项集的算法大多采用的类Apriori算法存在通信量大、同步次数和数据库扫描次数较多等问题,提出了一种基于频繁模式树的快速挖掘全局频繁项集算法(FAMGFI).该算法让各计算机结点采用FP—growth算法独立地计算局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.FAMGFI算法采用自顶向下和自底向上策略,能大大降低通信量.理论分析和实验结果表明FAMGFI算法是快速而有效的.  相似文献   

20.
探讨了基于数据挖掘技术的ERP系统的特征、功能、结构和实施与应用,提出了基于数据挖掘技术的ERP系统的体系结构和主要模式,为企业深入使用ERP提供了一般的模式。分析了该模式实现的方法,最后研究了相应的实施与应用的管理机制。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号