首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 100 毫秒
1.
关联规则挖掘是数据挖掘的重要领域之一,目前多数监督学习算法对满足最小支持度和最小置信度的关联规则进行深入分析的较少。剖析了分类关联规则挖掘算法CAR-Apriori算法,并提出了一种基于多最小支持度和支持度差别限制的分类关联规则挖掘算法MSCAR-Apriori算法。实验结果表明,改进算法不仅可以挖掘出满足给定条件的分类关联规则,同时还可以保留稀有但用户感兴趣且可能蕴涵巨大利润的规则项。  相似文献   

2.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进.  相似文献   

3.
针对关联规则挖掘过程中定义最小支持度与置信度的阈值具有主观性的问题,提出一种迭代粒子群优化(particle swarm optimization,PSO)的方法挖掘关联规则。通过定义要提取的规则数目(M)的值,采用支持度和置信度定义适应函数,粒子群优化算法迭代,从数据集中提取最优的规则。算法避免了apriori算法需要设定最小支持度和最小置信度阈值等问题。通过对3个不同类型典型数据集挖掘验证算法的有效性,结果表明,使用PSO获得的规则平均支持度和置信度与apriori算法挖掘到的规则相比有明显提高。  相似文献   

4.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进。  相似文献   

5.
最频繁项集挖掘决定了文本关联规则挖掘算法的性能,是文本关联规则挖掘中研究的重点和难点。该文分析了当前最频繁项集挖掘方面的不足,改进了传统的倒排表,结合最小支持度阈值动态调整策略,提出了一个新的基于改进的倒排表和集合理论的Top-N最频繁项集挖掘算法。同样,给出了几个命题和推论,并把它们用于该文算法以提高性能,实验结果表明,所提算法的规则有效率和时间性能优于NApriori算法和IntvMatrix算法。  相似文献   

6.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点.针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,对该算法进行了阐述.最后对该算法的特点进行了总结并对关联规则挖掘的未来研究方向进行了展望.  相似文献   

7.
关联规则挖掘算法中常用的支持度和可信度是对关联规则在统计意义上的有效性度量,在挖掘结果的有用度上缺乏指导作用,它们不能作为有用性的指标.从数据挖掘的最终目的出发定义了基于最终用户实际目标的效益度指标,并对最小效益度筛选性质进行了论证,提出了一种快速有效的关联规则挖掘算法.讨论了从关联规则的兴趣模板和限制模板转换到效益度的方法.实验结果表明,效益度指标具有支持度与可信度不可替代的作用;该算法的最小效益度剪切技术是有效的,不仅可以较大幅度地提高算法速度,而且可以作为规则模板的统一实现算法以及提供更精确的控制.  相似文献   

8.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点。针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,对该算法进行了阐述。最后对该算法的特点进行了总结并对关联规则挖掘的未来研究方向进行了展望。  相似文献   

9.
重点回顾基于单向函数的伪随机产生器,以及通用单向哈希函数的研究现状,介绍相关研究的最新进展,并对通用单向哈希函数设计方法给出系统性阐述。单向函数蕴涵伪随机产生器是密码学中的基础问题,是现代密码学的基础。单向函数可以用来构造伪随机产生器进而构成流密码算法,或是在伪随机产生器的基础上进一步构造伪随机函数和伪随机置换从而用作分组加密算法。随机迭代技术被提出并经精练后,可用于基于规则单向函数的伪随机产生器设计。单向函数蕴涵通用单向哈希函数是现代密码学最核心的基础理论之一。关于通用单向哈希函数可以基于任意单向函数构造而来。通用单向哈希函数的应用包括基于最小假设的数字签名、Cramer-Shoup加密体制、统计隐藏承诺体制等。  相似文献   

10.
一种多重最小支持度关联规则挖掘算法   总被引:5,自引:0,他引:5  
针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同数据项的特点定义多重支持度,通过挖掘数据库中的最大频繁项目集,计算最大频繁候选项目集在数据库中的支持度来发现关联规则.该算法可以解决关联规则挖掘中经常出现的稀少数据项问题,并解决了传统的关联规则挖掘算法中的生成频繁候选集和多次扫描数据库的性能瓶颈.实验结果表明,本文提出的算法在功能和性能方面均优于已有算法.  相似文献   

11.
1 INTRODUCTIONDatamining (DM )istheprocessofextractingvaluableknowledgehiddeninlargevolumesofrawda ta[1 15] .Aneffectivedataminingmethodshoulden abletheuserstoexplorethedatawarehouse ,selectallkindsofrelativedata ,conductanalysisatdifferentlevelsandfinally publishknowledgeinvariousfor mats.However ,theabundanceofthedatainthedatawarehouse(DW )canalsoaffecttheefficiencyofDM ,thereasonofwhichliesinthefollowingaspects[2 4 ] :1)agreatnumberofdataoftenresultinmultiplescanintheDWandtherefor…  相似文献   

12.
在数据挖掘技术中,关联规则可以挖掘发现大量的数据中项集之间有趣的关系或相关联系。冰山查询是关联规则挖掘的一种算法,特别是针对购物篮分析。介绍了数据挖掘的具体应用,使用改进的BUC算法(BUCE算法)以深度优先的处理方法,并综合其他传统算法,提高了处理冰山查询的有效性。同时BUCE算法在数据分组后聚集,减少I/O开销;对分组的数据排序,有利于数据的剪枝处理,将小于最小支持度的分组以后的数据可以全部剪去。所以BUCE算法提高了BUC算法的执行效率  相似文献   

13.
提出一种基于分布式哈希表(DHT)的分布式子空间聚类(DISCLUS)算法,该算法对各结点存储的数据分别进行子空间聚类,对聚类结果进行合并,得到分布式系统的聚类结果.针对子空间聚类的特点,提出结果集缩减和结果集剪枝策略对结点间通讯进行优化.为实现结点聚类结果合并,提出分布式表决算法(DDV).该算法利用底层覆盖网的拓扑结构进行层次化表决信息收集,在动态网络环境中实现了对所有结点的无冗余覆盖.理论分析和实验表明,DISCLUS算法的聚类误差和通讯性能能够较好地适应系统数据集规模、网络规模和数据空间维度的增加.  相似文献   

14.
为解决FP(frequent pattern)-growth算法中构造频繁模式树(FP-树)所带来的存储和遍历开销较大的问题,提出了一种基于动态裁剪FP-树的频繁项集并发算法Dynamic prune。一方面,通过记录FP 树构造过程中频繁项目计数的变化,实现了FP 树的动态剪枝;另一方面,使用并发策略达到了边构造FP-树,边挖掘频繁项集的效果。与FP growth算法相比,Dynamic-prune无需先构造整棵FP-树再挖掘频繁项集,节省了FP-树的存储开销。实验结果表明Dynamic-prune在运行效率和可扩展性上均优于FP growth算法。  相似文献   

15.
基于关联图的频繁闭模式挖掘   总被引:1,自引:1,他引:0  
将关联图的数据挖掘思想应用到频繁闭模式的挖掘中,使用位向量的技术简化项集支持度的计算,构造关联图表示项集间的频繁关系.在此基础上,提出一种频繁闭模式挖掘算法,针对频繁闭模式的特点,结合剪枝策略、子集检测策略、搜索策略等技术手段,优化算法性能.实验结果表明,该算法在时间性能上优于经典的频繁闭模式算法CLOSET.  相似文献   

16.
以往大多告警分析研究都是假设通信网络中所有告警是平等的,考虑此假设的不合理性,提出了一种加权告警分析方法。首先,根据告警对网络的影响程度,采用熵值法为不同的告警分配不同的权值,并将其转换成适合于数据挖掘的序列数据集;然后,设计了一种加权告警序列模式挖掘算法,并采用了一种新颖的剪枝策略来缩减需要挖掘的数据集大小以提高算法的效率;最后,利用该算法挖掘告警数据中的时序关系。实验结果表明,这种加权告警分析方法在剪枝效果、挖掘重要告警序列模式和执行效率方面具有很好的性能。  相似文献   

17.
王璇 《丹东纺专学报》2011,(2):154-158,163
将关联图的数据挖掘思想应用到频繁闭模式的挖掘中,使用位向量的技术简化项集支持度的计算,构造关联图表示项集间的频繁关系。在此基础上,提出一种频繁闭模式挖掘算法,针对频繁闭模式的特点,结合剪枝策略、子集检测策略、搜索策略等技术手段,优化算法性能。实验结果表明,该算法在时间性能上优于经典的频繁闭模式算法CLOSET。  相似文献   

18.
为减少高昂的计算代价 ,用挖掘最大频繁模式集代替挖掘频繁模式集是近年来提出的一个重要研究策略。由最大频繁模式集可求出所有频繁模式 ,但数量上却可以小几个数量级 ,从而可大大减少计算代价。通过对最大频繁模式挖掘的问题描述 ,以及关键问题的分析 ,针对频繁模式树 (FP- tree)和最大频繁模式的特点 ,给出了基于频繁模式树的最大频繁模式挖掘算法 (MMFP) ,采取先挖掘候选最大频繁模式再判断子集的方法 ,经示例分析表明该算法是有效的。提出的单路径修剪和项目修剪等修剪方法大大减少了侯选最大频繁模式的个数 ,对算法的性能提高起到了关键作用。  相似文献   

19.
大量的候选项集是挖掘路径遍历模式中的主要问题.针对这个问题,提出了基于DHP算法的路径遍历算法,通过使用哈希技术在产生侯选项集时删除不满足条件的项目,这种方法特别是在产生候选2-项目时效率非常高,这样很好的解决了整个处理过程的性能瓶颈.另外,使用了整枝技术使事务数据库的大小在每次扫描后迅速减小.实验结果表明,基于DHP的频繁遍历路径算法在挖掘频繁项目集时是有效的.  相似文献   

20.
提出了一种基于时滞混沌系统的带密钥Hash函数算法,该算法利用时滞混沌系统非线性动力学特性,将需要传送的明文信息调制在时滞混沌迭代的轨迹中,并通过HMAC-MD5算法计算得出Hash值,Hash值的每个比特都与需传送的明文信息相关.该算法使Hash值对明文信息及时滞混沌迭代初始条件的微小变化高度敏感.理论分析和仿真结果...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号