首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 265 毫秒
1.
通过分析 Apriori 核心算法,使用案例描述 Apriori 算法设计思想上所存在的不足,引入兴趣度阈值对 Apriori 关联规则进行了改进. 并将该改进后的算法对电子病历数据库中数据进行关联规则提取,建立了基于兴趣度的 Apriori 算法的医疗诊断模型. 通过实验证明,该模型能够提取具有诊断价值的关联规则并提高医生的诊断效率.  相似文献   

2.
通过分析Apriori核心算法,使用案例描述Apriori算法设计思想上所存在的不足,引入兴趣度阈值对Apriori关联规则进行了改进.并将该改进后的算法对电子病历数据库中数据进行关联规则提取,建立了基于兴趣度的Apriori算法的医疗诊断模型.通过实验证明,该模型能够提取具有诊断价值的关联规则并提高医生的诊断效率.  相似文献   

3.
基于高频模式树的项约束关联规则发现方法   总被引:3,自引:0,他引:3  
项约束关联规则发现是在关联规则发现中加入先验知识、提高算法执行效率、精简所发现的规则数量的重要方法,现有的项约束关联规则发现算法都基于Apriori算法框架,在高密度数据库上的执行性能不佳,而且没有提出高效的约束条件检验方法,在一种新型高效关联规则发现算法FP-Growth的基础上,提出了一种全新的项约束关联准则发现算法FPC。FPC算法利用FP-Growth算法逐步生成高频项集的方式,构造了一种约束数据结构,及时检查高频项集满足约束条件的情况,尽早删去不满足约束的条件,实验证明,此算法执行效率比Reorder等基于Apriori的算法高一个数量级。  相似文献   

4.
针对Apriori算法需要多次扫描数据库的缺陷,提出一种基于垂直事务关系的改进算法XApriori。该方法对原始事务数据库扫描后,采用项集事务垂直对应关系的位集合数据存储结构,并构建逻辑生成候选项集策略,利用数值统计的方法生成候选项集并确定频繁项集,实现关联规则的挖掘。对比实验结果表明,改进算法比Aprior算法关联规则挖掘的效率有所提高。  相似文献   

5.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进.  相似文献   

6.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进。  相似文献   

7.
给出了页面兴趣度的定义,并针对传统的Apriori关联规则算法必须经过大量反复扫描数据库才能产生候选项集的问题,提出了一种改进算法.此算法将数据库经过预处理后,对事务数据库进行分段,比较时可不针对所有事务记录,从而减少比较时间.最后将页面兴趣度应用于改进的Apriori算法中,形成一种基于页面兴趣度的关联规则算法--I_NEW_AR算法.实验结果表明,该算法不仅提高了挖掘效率,而且应用于网上推荐系统具有较好的准确率.  相似文献   

8.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

9.
介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出改进Apriori算法。该算法通过构造辅助表,减少访问表中的无效记录,从而减少每次访问数据库的次数,较好地提高了效率。实验结果表明,改进后的算法具有较好的有效性。  相似文献   

10.
通过研究基于两阶段频集思想的Apriori算法,针对Apriori算法的性能瓶颈提出了改进的Apriori算法,利用改进的Apriori算法对乳腺疾病数据进行挖掘,使用SQLServer2005数据挖掘工具,主要建立肿瘤复发和其他属性间的关联规则.挖掘结果证明了关联规则算法在医疗数据挖掘中的有效性.  相似文献   

11.
应用关联规则挖掘对高校课程相关性进行了研究.将某高校的毕业生成绩数据库经过预处理之后,采用不设定成绩界限的方法,用改进的Apriori算法进行挖掘.不仅能挖掘出成绩为优时的课程相关规则,还能发现若某些课程成绩差,则其他课程成绩也为差的规则,可以为学分制体系下学生选课和管理者进行决策等提供参考.  相似文献   

12.
关联规则挖掘是数据挖掘领域中的重要研究方向,该文在分析关联规则挖掘Apriori算法原理和性能的基础上,指出了该算法存在着两点不足:扫描事务数据库的次数和连接成高维候选项目集时的比较次数太多。并提出了一种效率更高的S-Apriofi算法,该算法通过采用新的数据结构和原理,克服了传统Apriori算法的缺点,从而大大提高了运算效率。  相似文献   

13.
对Apriori算法加以改进,提出了一种更高效的关联规则挖掘算法,在扫描数据库的同时把支持每个项目的事务都标记出来,采用一种新的方法来计算候选项目集的支持度.该算法只需对源数据库进行一次扫描,就可以找出所有的频繁集,具有很高的效率.  相似文献   

14.
Apriori算法的改进   总被引:2,自引:0,他引:2  
针对Apriori算法要多次扫描事务数据库以及生成大量候选集缺陷,在候选集C_1中增加事务标识符列表Tid_list实现只扫描一遍事务数据库,利用频繁项目集的性质来减少生成候选集的数量,提高了算法效率.  相似文献   

15.
在关联规划挖掘理论研究上,首次给出了项目序列集格空间,并且探讨了在这个空间上的基本操作算子、基于项目序列集格空间及其操作,建立了关联规则挖掘模型.在关联规则挖掘算法方面,设计了基于项目序列集操作理论的关联规则挖掘算法SIS,该算法执行时间整体上优于Apriori算法,而且随着数据量的增大,该算法执行时间的增长幅度也小于Apriori算法.  相似文献   

16.
Apriori算法是挖掘布尔关联规则频繁项集的最有影响的数据挖掘算法之一,但由于数据挖掘本身决定其面临的是海量数据,因此在许多情况下会产生大量候选项集,从而严重影响挖掘的效率。本文提出一种简单有效的Apriori改进算法。  相似文献   

17.
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号