首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 296 毫秒
1.
通过实例分析了支持度-置信度模型的缺陷和Apriori算法忽视反面示例的不足.引入了PS改进方法作为兴趣度,并设计了基于该兴趣度的关联规则挖掘算法.后通过实例对挖掘算法进行适当的分析,从而验证了该方法的有效性.  相似文献   

2.
对挖掘关联规则中的FUP算法的关键思想以及性能进行了研究,针对挖掘关联规则中FUP算法的不足,提出了一种基于临时表的改进算法MFUP.该算法通过建立临时表,充分利用原数据库挖掘的结果,从而大大减少了对数据的重复扫描,提高了数据挖掘算法的效率.通过实例分析,说明了MFUP算法的优越性.  相似文献   

3.
介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出改进Apriori算法。该算法通过构造辅助表,减少访问表中的无效记录,从而减少每次访问数据库的次数,较好地提高了效率。实验结果表明,改进后的算法具有较好的有效性。  相似文献   

4.
该文针对免疫遗传算法的不足,在分析其特性的基础上,引入了隔离小生境技术,改进交叉算子和变异算子,提出一种改进算法。在基于模糊关联规则挖掘的异常检测中采用本算法优化后的隶属函数,能够扩大正常关联规则集之间的相似度,缩小正常与异常关联规则集之间的相似度,提高异常检测的性能。通过以网络流量为数据的异常检测实验仿真对算法进行了验证。实验结果说明了该算法的可行性和有效性。  相似文献   

5.
FP__growth算法是基于FP树挖掘频繁项目集的关联规则经典算法,在许多领域中有很高的应用价值。针对传统的FP__growth算法可能产生大量的频繁项集,对FP树的挖掘过程进行了改进,提出了一种项合并剪枝的挖掘策略,进而分析了单路径和多路径的挖掘方法,减少了部分分支的挖掘次数。然后利用MapReduce模型,针对改进的算法并行化实现。实验结果表明该方法提高了算法的执行效率,并且具有良好的加速比和较好的扩展性。  相似文献   

6.
针对中文图书评论中的产品特征提取问题,本文基于FP-Growth算法进行图书评论特征提取,并在此基础上对挖掘过程进行了适应性改进.首先利用冗余词典减少冗余度以解决挖掘结果冗余度大的问题;然后根据评论长度赋予不同支持度的权重改进FP-Growth算法;最后根据独立支持度和各特征词的置信度对候选特征词进行过滤筛选.本文采用亚马逊网站上的真实图书评论数据进行实验验证,实验结果证明,该算法与传统FP-Growth算法、Apriori算法和TF-IDF算法挖掘结果相比,查全率显著提高,综合值也有所提高.  相似文献   

7.
最频繁项集挖掘决定了文本关联规则挖掘算法的性能,是文本关联规则挖掘中研究的重点和难点。该文分析了当前最频繁项集挖掘方面的不足,改进了传统的倒排表,结合最小支持度阈值动态调整策略,提出了一个新的基于改进的倒排表和集合理论的Top-N最频繁项集挖掘算法。同样,给出了几个命题和推论,并把它们用于该文算法以提高性能,实验结果表明,所提算法的规则有效率和时间性能优于NApriori算法和IntvMatrix算法。  相似文献   

8.
增量式更新算法能充分利用已挖掘出的知识来提高挖掘效率,是数据挖掘高效算法中的一个主要方向.分析了典型的关联规则增量式更新算法波折法FUP算法的不足,提出了一种改进的关联规则增量式更新算法,新算法极大地降低了存储空间和挖掘时间需求,从而提高了整个关联规则挖掘的效率.  相似文献   

9.
通过对Apriori算法的频繁项目集的分析研究,给出了基于图的频繁项集挖掘算法.该算法在求频繁K-项集的过程中只需一次扫描数据库,避免了Apriori算法需多次扫描数据库的不足。同时,由于在有向图中利用有限节点之间的路径求频繁K-项集,该算法减少了Apriori算法中需多次进行连接运算的不足。  相似文献   

10.
基于MapReduce的频繁项集挖掘方法   总被引:2,自引:0,他引:2  
为了改进关联规则挖掘的经典Apriori算法,设计一种基于Map/Reduce的频繁项集挖掘方法。通过搭建Hadoop平台,可使该方法得以实现,并籍此对该方法与Apriori算法的性能进行比较研究。实验结果表明该方法在对大数据集进行频繁项集挖掘时,可充分利用云计算的优势,从而能获得更好的时效性。  相似文献   

11.
在舆论分析系统中,高效、准确地获取敏感词一直是研究的热点。由于Apriori算法能较好地挖掘出事务之间的关系,并能快速找出新的敏感词,所以探索改进的Apriori算法显的更为重要。本文分析了经典Apriori算法的不足,提出了改进的Apriori算法,优化了程序执行的效率。实验结果表明:改进后的Apriori算法的执行效率比经典Apriori算法的执行效率要高。  相似文献   

12.
关联规则挖掘是数据挖掘领域中的重要研究方向,该文在分析关联规则挖掘Apriori算法原理和性能的基础上,指出了该算法存在着两点不足:扫描事务数据库的次数和连接成高维候选项目集时的比较次数太多。并提出了一种效率更高的S-Apriofi算法,该算法通过采用新的数据结构和原理,克服了传统Apriori算法的缺点,从而大大提高了运算效率。  相似文献   

13.
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

14.
基于图的Apriori改进算法   总被引:3,自引:0,他引:3  
Apriori算法是关联规则挖掘中的经典算法,算法的核心思想是一种基于频繁理论的自底向上的递推方法。文中对Apriori算法进行分析,发现其中存在的问题。对Apriori算法做了改进。改进后的算法基于自顶向下的思想。利用有向图给出计算候选项集和项集支持度计数的更快的方法,同时简  相似文献   

15.
提出了一种易于改进的AprioriTid优化算法,它的特点是:一项频繁集和二项频繁集用经典Apriori算法实现,三项及其以上频繁集采用AprioriTid优化算法的思想,即项目集采用关键字识别来统计支持度.实验结果表明,算法易于实现,比AprioriTid优化算法有更好的性能.  相似文献   

16.
通过分析Apriori核心算法,使用案例描述Apriori算法设计思想上所存在的不足,引入兴趣度阈值对Apriori关联规则进行了改进.并将该改进后的算法对电子病历数据库中数据进行关联规则提取,建立了基于兴趣度的Apriori算法的医疗诊断模型.通过实验证明,该模型能够提取具有诊断价值的关联规则并提高医生的诊断效率.  相似文献   

17.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进.  相似文献   

18.
利用广义相关系数改进的关联规划生成算法   总被引:3,自引:0,他引:3  
提出了一种改进的关联规则生成算法,其目的是在大型数据库中能够高效的发现关联知识。为了达到这个目标,将泛逻辑中的广义相关系数与Apriori算法相结合。Apriori算法本身对于大型数据库来说是高效的,但通常会产生出太多的关联规则,而广义相关系数是一个新的能够度量相关性的参数,因此对它进行了详细分析,并与原算法所使用的条件概率方法进行了比较,该算法有效地改进了由Agrawal提出的关联规则生成算法。  相似文献   

19.
提出了一种基于MapReduce模型,利用向量矩阵和Apriori算法实现关联规则数据挖掘的新算法.算法利用MapReduce模型处理向量矩阵,结合Apriori算法思想,产生局部频繁项集,通过合并处理得到全局频繁项集.实验证明算法能提高关联规则挖掘的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号