首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
针对Apriori算法寻找频繁项集需要反复扫描数据库的问题,提出了一种将事务数据布尔化,并在其基础上通过优化连接和剪枝,快速查找频繁项集的思想。即通过优化连接和剪枝,减少候选项集,并根据判断相应布尔向量"与"运算的结果,快速地归纳出频繁项集。研究和实验表明,该算法不仅只需扫描一次数据库,而且还具有查找速度快,节省内存空间和处理项目集维数多等优点。  相似文献   

2.
Apriori算法是挖掘关联规则频繁项集的最有影响的算法之一,它通过连接、剪枝等步骤产生频繁项集,进而产生强关联规则。由于面临海量数据,因此将会产生大量的候选项集,尤其是候选2-项集,严重影响了挖掘的效率。提出了一种改进的算法,此算法不产生小项候选集而直接产生大项候选集,从而提高了算法的效率。  相似文献   

3.
为提高网络告警数据的处理效率,迅速找出故障根源,以保证整个电信网络的正常运行。针对告警数据的特点对传统的关联规则算法进行了相应的改进,提供了优先剪枝策略,避免了生成没有意义的频繁项集;k-1-项集通过连接操作生成k项集,避免了反复扫描数据库所带来的压力。结果表明,改进算法提高了挖掘效率,达到快速诊断网络故障的目的。  相似文献   

4.
为了对学生考试成绩数据进行分析,提出一种改进的Apriori算法.在垂直数据表示方式上采用广度优先搜索和交叉计数,充分发挥垂直数据表示与交叉技术的效率优势,同时利用Apriori算法的剪枝策略,有效减少计数后选项集的数目.最后将改进后Apriori算法应用于考试成绩分析,实验结果发现学生各科目考试成绩优良影响关系,为学...  相似文献   

5.
关联规则挖掘中最大频繁集的双向查找算法   总被引:5,自引:0,他引:5  
在事务数据库中挖掘关联规则已成为数据挖掘领域的一个重要研究课题,而其中频繁项集的查找时间是影响挖掘效率的关键因素。基于Apriori算法,根据最大频繁集的双向查找算法,提出了算法的实现步骤,让两个方向的剪枝工作实现信息共享,加快最大频繁集的查找速度,节省I/O操作时间,并且通过实例和仿真实验验证了算法的高效性。  相似文献   

6.
在对Apriori算法的特性进行详细的介绍和总结的基础上,提出一种新的不产生候选项集的,以及只进行少量数据库扫描的挖掘频繁项集的算法SI-tree(Supper-Item Tree),该算法通过搜索数据库和一次性地找出当前项的所有超集来查找频繁项集.最后通过实验对2种算法进行了比较.  相似文献   

7.
提出了一种基于最小支持度变化的挖掘最大频繁项集的增量式更新算法MFIU(Maximum Frequent Itemsets Updating).针对最大频繁项集更新时的特性,分别对最小支持度变大和变小提出了两种不同的处理方法,对于最小支持度变大的复杂情况,采取了分块的更新策略,并为减少不必要的候选项集,利用了如果X是一个最大频繁项集,则其所有子集都是频繁项集,但都不可能是最大频繁项集,而进行了独特的剪枝方法.最后通过实例分析了该算法.  相似文献   

8.
一种Apriori的改进算法   总被引:3,自引:0,他引:3  
在对关联规则挖掘算法Apriori进行深入研究的基础上,提出了一种采用频繁项集Lk-1 与L1连接生成候选项集Ck的思想,并基于这种新的思想提出了一种优化的算法1-K_Apriori算法.在真实数据集和实验数据集上所做的实验及结果表明,1-K_Apriori算法是有效的.  相似文献   

9.
基于关联图的频繁闭模式挖掘   总被引:1,自引:1,他引:0  
将关联图的数据挖掘思想应用到频繁闭模式的挖掘中,使用位向量的技术简化项集支持度的计算,构造关联图表示项集间的频繁关系.在此基础上,提出一种频繁闭模式挖掘算法,针对频繁闭模式的特点,结合剪枝策略、子集检测策略、搜索策略等技术手段,优化算法性能.实验结果表明,该算法在时间性能上优于经典的频繁闭模式算法CLOSET.  相似文献   

10.
为解决FP(frequent pattern)-growth算法中构造频繁模式树(FP-树)所带来的存储和遍历开销较大的问题,提出了一种基于动态裁剪FP-树的频繁项集并发算法Dynamic prune。一方面,通过记录FP 树构造过程中频繁项目计数的变化,实现了FP 树的动态剪枝;另一方面,使用并发策略达到了边构造FP-树,边挖掘频繁项集的效果。与FP growth算法相比,Dynamic-prune无需先构造整棵FP-树再挖掘频繁项集,节省了FP-树的存储开销。实验结果表明Dynamic-prune在运行效率和可扩展性上均优于FP growth算法。  相似文献   

11.
针对聚类布尔矩阵的Apriori算法—CBM_Apriori算法的不足之处,提出了一种基于聚类布尔矩阵的Eclat算法—CBM_Eclat算法。该算法首先对布尔矩阵使用K-medoids算法,获得权值和聚类后的布尔矩阵;然后将聚类后的布尔矩阵转换成Tidset,并采用逻辑"交操作"运算,进而有效地减少了聚类布尔矩阵存储和候选项集的生成,提高了该算法的执行效率。通过实例应用和算法执行结果都能够证明CBM_Eclat算法具有可行性和有效性。  相似文献   

12.
针对目前大多数Apriori改进算法在处理大数据集时所面临的性能瓶紧问题,该文以项集中各项在事务中的概率分布特征为切入点,并在BF-Apriori的逆序编码算法基础上,设计基于逆序转换的模式匹配算法和候选频繁项集生成算法,以提高规则挖掘过程的时间效率.最后,3个子算法构成了该文所提出的Apriori改进算法BF_Adv...  相似文献   

13.
针对垂直分布下的隐私保护关联规则挖掘算法效率低、安全性不高的问题,提出一种隐私保护频繁闭合项集的挖掘算法。算法利用挖掘频繁闭合项集代替频繁项集,IT-Tree作为搜索空间,Diffsets作为压缩结构,采用基于RSA可交换加密算法的隐私保护集合差集协议。实验结果表明,算法具有较好的隐私性、准确性、高效性。  相似文献   

14.
基于FP-tree的快速数据挖掘算法   总被引:1,自引:0,他引:1  
针对挖掘全局频繁项集的算法大多采用的类Apriori算法存在通信量大、同步次数和数据库扫描次数较多等问题,提出了一种基于频繁模式树的快速挖掘全局频繁项集算法(FAMGFI).该算法让各计算机结点采用FP—growth算法独立地计算局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.FAMGFI算法采用自顶向下和自底向上策略,能大大降低通信量.理论分析和实验结果表明FAMGFI算法是快速而有效的.  相似文献   

15.
研究了FTF算法和LSL算法实现的预测误差滤波器对雷达地杂波和气象杂波的抑制性能,计算了杂波滤波器的改善因子。计算机仿真结果表明,LSL和FTF算法可以对杂波进行较大抑制,当用于目标检测时,FTF算法具有较高的信杂比改善能力。  相似文献   

16.
现有的贝叶斯网络结构学习算法都需要对高维数据项集进行大量地计算,极大地影响了算法的可靠性、健壮性以及精确度,同时高维计算也耗费了大量时间,为了解决这个问题,提出基于特征选择技术贪婪贝叶斯网络结构学习算法。理论分析表明,本算法在效率上优于现有算法,实验结果也表明,对于高维相对小采样数据集,本算法在精度上也优于大多数算法。  相似文献   

17.
关联规则是数据挖掘研究的一个重要课题 ,而最大频繁项集的生成是影响关联规则挖掘的关键问题 .在已有的频繁集发现算法中 ,DLG算法通过减少事务数据库的扫描次数 ,进而有效减少挖掘过程的I/O代价 .在阐述DLG算法的实现原理与执行过程的基础上 ,为进一步减少候选项集的数量 ,提出一种改进算法DLG .其主要思想是在关联图构造阶段 ,统计每一个频繁项目的入度 ,以此作为剪枝的依据 .性能分析和比较试验的结果表明该算法性能优良  相似文献   

18.
基于决策树的启发式流分类算法目标是建立结点数目尽可能少,树深度尽可能小的数据结构,从而获得较优的时空性能。本文提出的基于参数评估的可调节式流分类算法(PEA:Parameter Evaluation Adjustable algorithm)一方面沿袭目前主流的决策树类流分类算法思想,一方面引入性能参数的概念,并采取调节参数权值的方式获得性能最佳的数据结构。大量测试结果表明,相同条件下本算法对比同类算法能够获得更优的性能结果。  相似文献   

19.
Behavioral decision-making at urban intersections is one of the primary difficulties currently impeding the development of intelligent vehicle technology. The problem is that existing decision-making algorithms cannot effectively deal with complex random scenarios at urban intersections. To deal with this, a deep deterministic policy gradient (DDPG) decision-making algorithm (T-DDPG) based on a time-series Markov decision process (T-MDP) was developed, where the state was extended to collect observations from several consecutive frames. Experiments found that T-DDPG performed better in terms of convergence and generalizability in complex intersection scenarios than a traditional DDPG algorithm. Furthermore, model-agnostic meta-learning (MAML) was incorporated into the T-DDPG algorithm to improve the training method, leading to a decision algorithm (T-MAML-DDPG) based on a secondary gradient. Simulation experiments of intersection scenarios were carried out on the Gym-Carla platform to verify and compare the decision models. The results showed that T-MAML-DDPG was able to easily deal with the random states of complex intersection scenarios, which could improve traffic safety and efficiency. The above decision-making models based on meta-reinforcement learning are significant for enhancing the decision-making ability of intelligent vehicles at urban intersections.  相似文献   

20.
Apriori算法的改进   总被引:2,自引:0,他引:2  
针对Apriori算法要多次扫描事务数据库以及生成大量候选集缺陷,在候选集C_1中增加事务标识符列表Tid_list实现只扫描一遍事务数据库,利用频繁项目集的性质来减少生成候选集的数量,提高了算法效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号