首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 46 毫秒
1.
针对负关联规则挖掘所带来的问题,提出加入最大支持度来控制频繁项集生成规模,改进了相关性的计算公式,并将其用作正负关联规则的兴趣度来剔除无兴趣的关联规则,限制关联规则中的前后件项目个数来保证挖掘出的关联规则的实用性和可理解性。最后,给出一种能够同时挖掘正负关联规则的算法,实验结果表明算法是有效的、可行的。  相似文献   

2.
通过实例分析了支持度-置信度模型的缺陷和Apriori算法忽视反面示例的不足.引入了PS改进方法作为兴趣度,并设计了基于该兴趣度的关联规则挖掘算法.后通过实例对挖掘算法进行适当的分析,从而验证了该方法的有效性.  相似文献   

3.
基于兴趣度含正负项目的关联规则挖掘方法   总被引:1,自引:0,他引:1  
项目的引入使得挖掘出的频繁项集成倍增加,同时生成的关联规则数量更加庞大,引入兴趣度来约束从频繁项 集中提取关联规则的数量。分析现有的兴趣度模型,从中选择了一种适合于含正负项目的关联规则挖掘的兴趣度方法,并且 提出了置信度的一个性质,描述了含正负项目的频繁项集挖掘关联规则的算法,并对矛盾关联规则进行了分析。实验结果表 明,该算法是有效和可行的。  相似文献   

4.
一种改进的关联规则挖掘算法   总被引:2,自引:0,他引:2  
本文在Aprioi算法的基础上,引入了临时数据库及多支持度,使交易数据库的规模不断缩小,同时又灵活控制了各频繁项集产生的数量,结果表明该算法对关联规则挖掘较为有效。  相似文献   

5.
一种多重最小支持度关联规则挖掘算法   总被引:5,自引:0,他引:5  
针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同数据项的特点定义多重支持度,通过挖掘数据库中的最大频繁项目集,计算最大频繁候选项目集在数据库中的支持度来发现关联规则.该算法可以解决关联规则挖掘中经常出现的稀少数据项问题,并解决了传统的关联规则挖掘算法中的生成频繁候选集和多次扫描数据库的性能瓶颈.实验结果表明,本文提出的算法在功能和性能方面均优于已有算法.  相似文献   

6.
关联规则挖掘算法中常用的支持度和可信度是对关联规则在统计意义上的有效性度量,在挖掘结果的有用度上缺乏指导作用,它们不能作为有用性的指标.从数据挖掘的最终目的出发定义了基于最终用户实际目标的效益度指标,并对最小效益度筛选性质进行了论证,提出了一种快速有效的关联规则挖掘算法.讨论了从关联规则的兴趣模板和限制模板转换到效益度的方法.实验结果表明,效益度指标具有支持度与可信度不可替代的作用;该算法的最小效益度剪切技术是有效的,不仅可以较大幅度地提高算法速度,而且可以作为规则模板的统一实现算法以及提供更精确的控制.  相似文献   

7.
基于兴趣度的规则优化算法通过整合用户领域知识,对规则进行了精简和优化,有效地帮助了用户发现其最感兴趣的规则.但算法仍存在兴趣度计算方式欠妥、用户含义表达受限等问题.提出对兴趣度计算方法的改进,对单模板情况下的计算进行分类讨论,解决了兴趣度计算不合理的问题.同时,新算法引入复合模板的技术,支持对规则的多维分析,丰富了用户含义的表达.通过2组对比实验验证,改进后的基于主观兴趣度的规则优化算法能导出更加合理的兴趣度排序结果,给用户提供更有价值的规则参考.  相似文献   

8.
给出了页面兴趣度的定义,并针对传统的Apriori关联规则算法必须经过大量反复扫描数据库才能产生候选项集的问题,提出了一种改进算法.此算法将数据库经过预处理后,对事务数据库进行分段,比较时可不针对所有事务记录,从而减少比较时间.最后将页面兴趣度应用于改进的Apriori算法中,形成一种基于页面兴趣度的关联规则算法--I_NEW_AR算法.实验结果表明,该算法不仅提高了挖掘效率,而且应用于网上推荐系统具有较好的准确率.  相似文献   

9.
针对已有的对低支持度关联规则进行挖掘的算法中没有提出对具有多个相关项的关联规则进行挖掘的有效方法,本文提出一种能够对低支持度关联规则的多个相关项进行有效挖掘的方法。算法基于相似度来衡量各个相关项的关联程度,在已有算法的基础上增加了一次特殊的矩阵转换,从而将对项的相似度衡量方法进行了转换,转换后的矩阵可以基于Apriori性质来拓展多个相似相关项。算法在低支持度情况下具有较高的挖掘效率和良好的挖掘效果,算法还可以用来挖掘多个项之间的排斥规则。  相似文献   

10.
基于chi square检验、有趣度及信息增益理论,给出一种挖掘优化关联规则的算法.该算法将冗余的规则分为:一规则缺乏统计相关性,二规则不满足"新奇"的要求.实验结果表明,该算法可有效去除冗余规则,提高挖掘效率.  相似文献   

11.
针对传统的关联规则数据挖掘的支持度-置信度框架存在很多缺陷,同时研究正负关联规则时可能产生很多问题的情况,阐述了在正负关联规则挖掘中,如何利用允许用户指定多重最小支持度来反应数据库中项的性质和它们各种各样的频率,并通过设置相关度提高挖掘效率.实验结果显示该方法是有效的.  相似文献   

12.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点.针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,对该算法进行了阐述.最后对该算法的特点进行了总结并对关联规则挖掘的未来研究方向进行了展望.  相似文献   

13.
针对并行关联规则挖掘算法不能有效的解决负载平衡的问题,在CD算法的基础上,介绍了一种基于动态数据集划分的并行关联规则挖掘算法.它根据各个节点的反馈来决定向每个节点分配的数据集大小.与静态的数据集划分相比,它能更好地实现负载平衡,提高并行数据挖掘的效率.  相似文献   

14.
关联规则挖掘的Apriori算法的改进   总被引:16,自引:0,他引:16  
提出一种将Apriori算法与散列技术和事务压缩技术相结合的改进算法,研究了散列函数的构造及其对算法效率的影响,分析了事务压缩技术的原理及其实现方法,用实例给出了原算法与改进算法的实现步骤,结果表明,新算法减小了存储空间,提高了算法的效率,并改进了数据挖掘技术的性能。  相似文献   

15.
传统的关联规则并行挖掘算法中存在着产生大量的候选项集和通信量高的缺点,本文在分析已有并行挖掘关联规则算法的优缺点的基础上,提出了一个效率较高的并行优化关联规则挖掘算法EPMAR(Efficient Parallel Mining Association Rules),并与其它相应的算法进行了比较.实验结果证明:算法EPMAR是有效的,具有一定的扩展性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号