首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 486 毫秒
1.
通过分析Apriori核心算法,使用案例描述Apriori算法设计思想上所存在的不足,引入兴趣度阈值对Apriori关联规则进行了改进.并将该改进后的算法对电子病历数据库中数据进行关联规则提取,建立了基于兴趣度的Apriori算法的医疗诊断模型.通过实验证明,该模型能够提取具有诊断价值的关联规则并提高医生的诊断效率.  相似文献   

2.
通过实例分析了支持度-置信度模型的缺陷和Apriori算法忽视反面示例的不足.引入了PS改进方法作为兴趣度,并设计了基于该兴趣度的关联规则挖掘算法.后通过实例对挖掘算法进行适当的分析,从而验证了该方法的有效性.  相似文献   

3.
给出了页面兴趣度的定义,并针对传统的Apriori关联规则算法必须经过大量反复扫描数据库才能产生候选项集的问题,提出了一种改进算法.此算法将数据库经过预处理后,对事务数据库进行分段,比较时可不针对所有事务记录,从而减少比较时间.最后将页面兴趣度应用于改进的Apriori算法中,形成一种基于页面兴趣度的关联规则算法--I_NEW_AR算法.实验结果表明,该算法不仅提高了挖掘效率,而且应用于网上推荐系统具有较好的准确率.  相似文献   

4.
通过研究基于两阶段频集思想的Apriori算法,针对Apriori算法的性能瓶颈提出了改进的Apriori算法,利用改进的Apriori算法对乳腺疾病数据进行挖掘,使用SQLServer2005数据挖掘工具,主要建立肿瘤复发和其他属性间的关联规则.挖掘结果证明了关联规则算法在医疗数据挖掘中的有效性.  相似文献   

5.
基于Apriori数据挖掘算法研究   总被引:3,自引:0,他引:3  
关联规则是从数据集中识别出频繁出现的属性值集,然后利用这些频繁集创建描述关联关系的规则过程.在分析经典关联规则挖掘算法的基础上,讨论了经典的Apriori算法,并提出改进的Apriori关联规则算法,对算法进行了实验数据的算法性能分析及运行时间对比.结果表明,改进的算法在运行速度和挖掘性能上都较经典的Apriori算法都有显著提高.  相似文献   

6.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进.  相似文献   

7.
根据日常商务数据的特点,提出了商业应用系统中进行数据挖掘的改进的Apriori算法和对点击流数据进行挖掘的改进的多支持度关联规则算法,并结合具体实例进行了分析.分析结果表明,2种改进的算法可以有效地提高系统数据挖掘的效率.  相似文献   

8.
基于数量的关联规则挖掘   总被引:4,自引:1,他引:3  
通过对现有问题的分析,提出了新的基于数量的关联规则挖掘的概念,分忻了有关的数量-支持度,并提出了一种改进算法,然后通过一个例子与传统的Apriori算法进行了对比分析。  相似文献   

9.
利用广义相关系数改进的关联规划生成算法   总被引:3,自引:0,他引:3  
提出了一种改进的关联规则生成算法,其目的是在大型数据库中能够高效的发现关联知识。为了达到这个目标,将泛逻辑中的广义相关系数与Apriori算法相结合。Apriori算法本身对于大型数据库来说是高效的,但通常会产生出太多的关联规则,而广义相关系数是一个新的能够度量相关性的参数,因此对它进行了详细分析,并与原算法所使用的条件概率方法进行了比较,该算法有效地改进了由Agrawal提出的关联规则生成算法。  相似文献   

10.
针对经典Apriori算法会产生大量冗余规则的缺点,在两方面对算法进行了改进:一方面是对产生频繁项集方式的改进,使算法只产生包含目标项的频繁项集;另一方面是对产生规则方式的改进,使算法只产生关联后件中包含目标项的关联规则.Apriori算法改进前后的对比表明:改进后的Apriori算法可以避免非目标规则的产生,使算法更符合成绩分析的需要,提高算法的执行效率.将改进的Apriori算法应用于成绩分析中表明,改进后的算法能够挖掘出各门前导课程成绩对后续课程成绩的影响,因此可为教师制定有针对性的教学计划提供参考.  相似文献   

11.
基于数据挖掘中的关联规则挖掘及Apriori算法,研究了在旅游行业中用挖掘得到的规则对突发事件进行预测的方法.对突发事件进行了预处理,对与突发事件相关的规则进行了挖掘,提出了改进的关联规则算法,并获得了有意义的规则输出,并对这些关联规则在旅游业的应用进行了研究.  相似文献   

12.
基于兴趣度含正负项目的关联规则挖掘方法   总被引:1,自引:0,他引:1  
项目的引入使得挖掘出的频繁项集成倍增加,同时生成的关联规则数量更加庞大,引入兴趣度来约束从频繁项 集中提取关联规则的数量。分析现有的兴趣度模型,从中选择了一种适合于含正负项目的关联规则挖掘的兴趣度方法,并且 提出了置信度的一个性质,描述了含正负项目的频繁项集挖掘关联规则的算法,并对矛盾关联规则进行了分析。实验结果表 明,该算法是有效和可行的。  相似文献   

13.
基于图的Apriori改进算法   总被引:3,自引:0,他引:3  
Apriori算法是关联规则挖掘中的经典算法,算法的核心思想是一种基于频繁理论的自底向上的递推方法。文中对Apriori算法进行分析,发现其中存在的问题。对Apriori算法做了改进。改进后的算法基于自顶向下的思想。利用有向图给出计算候选项集和项集支持度计数的更快的方法,同时简  相似文献   

14.
中医哮喘病案含有大量医家临床诊断获得的经验数据,利用数据关联分析方法可以挖掘医药方剂配伍规律及症状与用药之间的关联关系.文章主要研究了Apriori算法在挖掘医案数据时的性能与不足,并基于计算机对位串逻辑运算的快速反应,提出Apriori算法的改进算法——Apriori-BSO算法,并对比了两种算法的运行时效,结合经典Apriori算法,挖掘出频繁项集及强关联规则.实验证明,将Apriori改进算法应用于哮喘用药数据及症状-用药联合数据进行关联分析,挖掘出的医药方剂配伍规律及症状与用药之间的关联关系,在哮喘病案数据分析中效果良好,应用价值显著.  相似文献   

15.
基于关联规则的Web日志挖掘算法   总被引:1,自引:0,他引:1  
分析了经典的基于关联规则的Apriori挖掘算法,对该算法在Web日志挖掘中存在的不足进行了讨论。针对这些不足,对该算法进行了改进,并介绍了算法的具体实现。经实验测试,改进后的算法具有更好的效率。  相似文献   

16.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进。  相似文献   

17.
知识规则库的准确度是影响BBS舆情分析系统能否准确高效地对BBS舆情进行监控的一个重要因素.Apriori算法作为关联规则挖掘的经典算法,是发现关联规则的一种准确有效的方法.通过利用Apriori算法来动态更新知识规则库内容,实验结果表明,系统使用该算法后对BBS舆情监视的准确度有明显的提高.  相似文献   

18.
数据挖掘技术在高校学生就业指导决策中的运用   总被引:1,自引:0,他引:1  
高校学生的招生、就业等信息数量庞大,表目繁多,对这些数据有效地进行预处理,并进一步挖掘以获得有利于高校教学管理决策和毕业生就业指导的有用信息,具有重要意义.以沈阳市某高校学生招生就业数据为基础,建立了一个基于学生信息的关联规则挖掘系统,并对其中的Apriori算法进行优化,同时对由频繁项集生成关联规则的算法给予改进,挖掘结果中产生了大量有益信息,通过实际检验,该优化算法能避免大量无意义关联规则的产生并提高挖掘效率.  相似文献   

19.
Apriori算法分析与改进综述   总被引:5,自引:0,他引:5  
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性.通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题.本文介绍了能优化该技术的各种算法,分析了这些算法各自的优缺点,并针对这些问题提出了未来的研究方向.  相似文献   

20.
介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出改进Apriori算法。该算法通过构造辅助表,减少访问表中的无效记录,从而减少每次访问数据库的次数,较好地提高了效率。实验结果表明,改进后的算法具有较好的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号