首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数目常常是巨大的.文中介绍了简单关联规则和原关联规则的概念,而传统算法挖掘出的关联规则集中的任何规则,均可以由原关联规则导出,并且原关联规则的数目远远小于传统算法挖掘出的关联规则数目.对简单关联规则和原关联规则进行了分析比较,给出了挖掘原关联规则算法,并举例说明算法的执行过程.  相似文献   

2.
景波  刘莹  黄兵 《微计算机信息》2007,23(18):176-178
传统关联规则挖掘很少考虑关联规则的时间适用性.时态关联规则是指带有时态约束的关联规则,每个关联规则都有着其成立的时间区域.结合其他算法的特点,提出了基于Fisher聚类的时态关联规则挖掘算法,它能够动态地发现关联规则以及关联规则有效的时间区域.实验结果证明该算法是合理有效的。  相似文献   

3.
一种新的基于FP-Tree的关联规则增量式更新算法   总被引:2,自引:0,他引:2  
挖掘关联规则是数据挖掘研究的一个重要方面,目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而维护已发现的关联规则同样是重要的.针对在事务数据库增加和最小支持度同时发生变化的情况下,如何进行关联规则的更新问题进行了研究,提出了一种新的基于频繁模式树的关联规则增量式更新算法,并对该算法进行了分析和讨论.  相似文献   

4.
一般关联规则挖掘算法分为两步:第一步是发现频繁项目集;第二步是利用频繁项目集产生关联规则.文章讨论了现今关联规则挖掘算法的特点和不足,同时提出一种效率更高的挖掘算法.与其它算法不同的是,该算法侧重于知识领域的使用和关联规则系统应用的预备.  相似文献   

5.
提出了集成聚类分析、凸包分析、叠置分析和面积计算等各种地理空间分析与计算方法,实现了一种对在线地理数据进行地理空间关联规则挖掘的算法.该算法对非空间数据的关联规则发现算法Apriori进行了空间化处理,使该算法能够进行空间数据挖掘,发现空间关联规则.实现了在线地理空间数据的空间关联规则挖掘程序,并采用实际数据对算法进行了检验,验证了它们的可用性与有效性,并对挖掘所得的空间关联规则进行了多种可视化表达.从实验效果来看,空间关联规则的支持度和准确度主要依赖数据空间特征,如长度、面积(选择的计算基准)、体积等,发现了一些有趣的空间关联信息.  相似文献   

6.
关联规则是数据挖掘的主要技术,而最大频繁集是关联规则挖掘的核心.关联规则发现的准确性与效率的好坏直接决定了发现的知识规则是否适用.阐述了关联规则、频繁集和频繁超集的定义,分析了现有关联规则算法的思想及其不足,然后在概率的基础上引入了期望长,提出了ELMFI算法,最后用实例进行仿真实验并做了比较分析.该算法直接产生期望长度的候选项集并进行验算,试验结果验证了其可行性,发现效率有所提高,能节约大量的系统空间和运算时间.  相似文献   

7.
一种改进的Apriori算法   总被引:6,自引:2,他引:4  
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性.通过对关联规则挖掘技术及其相关算法Apaod进行分析,发现该技术存在的问题.Apriori算法是关联规则挖掘中的经典算法.对Apriori算法做了改进.借助0-1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率.  相似文献   

8.
左向科  邢永康  王嵘 《微处理机》2009,30(5):101-104
关联规则挖掘是数据库中知识发现研究的热点课题,有着广泛的应用领域.通过对关联规则中快速开采算法的研究分析,首先把已有的关联规则挖掘算法分为了两大类:传统类型的关联规则挖掘算法和多关系关联规则挖掘算法;重点分析基本类型算法,并提出各种改进的优化策略;然后对各类代表性算法进行了描述,分析和对比;最后,对尚存在的问题进行了分析和总结.  相似文献   

9.
基于动态剪枝的关联规则挖掘算法   总被引:13,自引:0,他引:13  
介绍了目前关联规则挖掘的研究工作 .分两个部分提出了基于动态剪枝的关联规则发现方法 .讨论了如何实施动态剪枝 ,给出了一个基于三元组结构的树式存储结构 ,在此基础上描述了交易数据库中知识发现算法 .并将提出的方法与关联规则挖掘中具有里程碑意义的 Apriori算法进行了对比分析 ,给出了相应的分析结果 ,实验表明该方法能有效地从数据集中发现关联规则  相似文献   

10.
基于Apriori&Fp—growth的频繁项集发现算法   总被引:6,自引:3,他引:3  
关联规则挖掘是数据挖掘中功能之一,而高效的关联规则挖掘算法研究引起了许多科研人员的兴趣.其中频繁项集的发现是关联规则挖掘算法中占比重最高、代价最大的步骤.从分析Apriori算法与Fp-growth算法性能的优缺点的基础上,提出了一种新的频繁项集发现算法:FA算法,该算法吸取了Apriori算法与Fp-growth算法的优点,通过实验表明该算法有较高的性能,且内存开销较少.  相似文献   

11.
谱聚类算法利用特征向量构造简化的数据空间,在降低数据维数的同时,使得数据在子空间中的分布结构更加明显。该文提出了一种粗糙谱聚类算法,并将其应用于文本数据挖掘。实验表明,该算法与现有的文本聚类算法相比,准确率有一定的提高。  相似文献   

12.
针对原有GPS线路生成算法复杂、生成线路效率低、数据量大的缺点,提出一种新的线路生成算法,用于解决多线路显示时的效率问题。新算法对原算法中的在相邻两点间画圆形区间的区间生成方式,进行改进,提出一种新的区间生成策略:只在两个车站(或分框特殊点)之间绘制区间矩形,并对线路的区间矩形进行扩展处理,大大减少原有的区间数量,提高了生成效率。同时对线路异常数据所造成的相交区间,提出拆分区间的算法来修正线路。实验结果表明,在加载5条线路时,解析、生成区间、显示线路所耗费的时间仅为32秒,说明该算法能够较好地提高数据处理效率。  相似文献   

13.
谱聚类算法利用特征向量构造简化的数据空间,在降低数据维数的同时,使得数据在子空间中的分布结构更加明显。该文提出了一种粗糙谱聚类算法,并将其应用于文本数据挖掘。实验表明,该算法与现有的文本聚类算法相比,准确率有一定的提高。  相似文献   

14.
在“信息爆炸”的当今社会,海量数据对数据挖掘提出新的挑战。在数据挖掘转向云计算平台实现并行化的同时,研究并行化数据随机抽样进一步降低处理的数据规模。提出一种单次扫描即可实现清理脏数据并实现等概率抽样的mapreduce并行抽样算法。在hadoop平台上实现并与普通随机抽样方法进行比较,得出其时间效率非常高,是一种行之有效的方法。为以后数据挖掘中的抽样研究和推动数据挖掘在海量数据下的发展奠定良好基础。  相似文献   

15.
针对传统Apriori算法挖掘警情数据的缺点,提出一种改进的Apriori算法。该算法首先在关联规则发现阶段引入权值参数,设计支持度阈值函数,以挖掘不常发生的重大案情发生规律;然后提出一种压缩矩阵优化算法,将数据压缩存储在只有0或1的矩阵中,并用2个数组来记录矩阵中每一行及每一列1的总数,可多次压缩矩阵,提升挖掘效率;最后将改进的算法用于实际的警情数据挖掘分析,给出关联规则挖掘结果。实验表明,改进算法不仅执行效率较传统算法有所提升,且针对警情数据的挖掘结果准确性也有所提高。  相似文献   

16.
基于行程时间多步预测的实时路径导航算法   总被引:3,自引:0,他引:3  
针对现有车辆导航算法仅考虑单一数据,使所得路径实际行程时间比预期更长的问题,首先建立了基于卡尔曼滤波理论的行程时间多步预测模型;其次,提出了综合利用实时数据、行程时间多步预测数据及历史数据的实时路径导航算法,并改进了其实现的核心算法Dijkstra_pred.实验结果表明,基于三类数据的实时路径导航算法所得路径的实际行程时间从整体上优于仅采用实时数据的导航算法,且路径变化较少.  相似文献   

17.
数据挖掘过程中只考虑数据项权重或者只考虑时态语义会导致挖掘结果不全面。针对该问题,对加权关联规则、时态关联规则和时态数据周期规律进行研究,将权值、K-支持期望和周期等概念引入到时态关联规则中,提出一种基于周期规律的加权时态关联规则挖掘算法。以某管理系统审计数据为例进行实验验证,结果表明该算法能够准确地挖掘出数据库中的加权时态关联规则,与加权关联规则算法相比,在时间复杂度相同的情况下能使关联规则的挖掘结果更加全面。  相似文献   

18.
关联规则发现是数据挖掘中的重要研究课题之一。将挖掘的数据事务集压缩到一个布尔型向量矩阵中,只需扫描数据库一次,合理利用数据存储结构,且不会产生大量的候选集。实验表明,该算法不仅实现简单,与经典的Apriori算法进行相比,效率也有大幅提高,特别对大事务集、长项目集数据挖掘效果更为明显。  相似文献   

19.
近年来,无线传感器网络离群数据检测研究越来越受到人们的关注。无线传感器网络离群数据检测在火灾监测、欺诈和入侵检测等诸多领域都有非常重要的作用。针对无线传感器网络集中式离群数据检测算法能量消耗过快的问题,提出了一种基于密度的分布式离群数据检测算法,并通过引入时空关联性有效提高了检测精度。通过NS2仿真实验,验证了该分布式算法节省了能量消耗,同时保持了较高的检测准确率。  相似文献   

20.
张伟  陈春燕 《计算机应用》2007,27(4):881-883
数据流具有数据量无限且流速快等特点,使得传统的聚类算法不能直接应用于数据流聚类问题。针对该问题,提出了一种基于概率密度的数据流聚类算法。此方法不需要存储全部的历史数据,只需要存储新到达的数据并对其应用EM算法,利用高斯混合模型增量式地更新概率密度函数。实验表明,该算法对于解决数据流聚类问题非常有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号