首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 546 毫秒
1.
介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出改进Apriori算法。该算法通过构造辅助表,减少访问表中的无效记录,从而减少每次访问数据库的次数,较好地提高了效率。实验结果表明,改进后的算法具有较好的有效性。  相似文献   

2.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进。  相似文献   

3.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进.  相似文献   

4.
关联规则挖掘的一种改进算法   总被引:4,自引:0,他引:4  
关联规则挖掘是数据挖掘中重要的研究课题,R.Agrawal和R.Srikant于1994年提出的Apriori算法是关联规则挖掘的最有影响的算法,针对Apriori算法中频繁项集产生效率低这个核心问题,本文给出分辨矩阵、分辨向量并提出基于分辨矩阵的改进算法,它能有效提高频繁集的产生效率.  相似文献   

5.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

6.
针对结构化数据进行关联规则挖掘的经典Apriori算法和由W3C推出的XML文档查询语言XQuery相结合,设计并实现了一个针对XML文档进行挖掘的算法XQ-Apriori.该算法可以直接对包括电子病历在内的各种XML格式的文档进行关联规则挖掘,挖掘过程无需进行数据转换。测试表明,该算法具有较高的效率。  相似文献   

7.
为了加强保险业务员业务能力, 提高被推荐保险产品的成交率, 基于经典关联规则挖掘算法Apriori, 提出了 一种改进算法Apriori based on difference set(DS_Apriori) 来计算符合条件的保险产品。贡献包括: ① 通过以键值方 式重新组织数据、根据时序划分数据集、降低迭代搜索的次数等方式来提高算法执行效率; ② 通过以客户为主键 聚合事务数据来挖掘潜在关联规则, 实现精准推送。实验表明所提出的DS_Apriori 算法执行效率优于Apriori 等算 法, 可以给保险业务员提供业务指导, 精准推荐最符合推荐条件的保险产品。  相似文献   

8.
在关联规划挖掘理论研究上,首次给出了项目序列集格空间,并且探讨了在这个空间上的基本操作算子、基于项目序列集格空间及其操作,建立了关联规则挖掘模型.在关联规则挖掘算法方面,设计了基于项目序列集操作理论的关联规则挖掘算法SIS,该算法执行时间整体上优于Apriori算法,而且随着数据量的增大,该算法执行时间的增长幅度也小于Apriori算法.  相似文献   

9.
分类和关联规则是数据挖掘领域中最流行的两种技术。文章在分析Apriori关联规则算法的原理的基础上,对分类与Apriori两种技术的不同特点进行了比较。根据不同点将Apriori算法作为核心技术引入到分类挖掘中,给出一个新的分类算法,从实例的结果可以知道该算法的正确性和有效性,尤其是它能够很容易的处理带有缺省属性值的记录。  相似文献   

10.
提出了一个基于最小完美哈希函数的关联规则的数据挖掘算法。基于Apriori的算法,在综合了传统哈希剪枝技术的同时,利用最小完美哈希函数的优点,保证了静态数据库关联规则挖掘,可以对关联规则的哈希结构数据进行动态的调整。该算法提高了挖掘效率,通过抑制哈希地址冲突提高了算法的稳定性和可用性。  相似文献   

11.
为了从海量的信息资源库中进行析取、识别和发现潜在正确和有用、前所未知的、最终可理解的知识,从数据挖掘技术的研究入手,对关联规则挖掘算法Apriori算法的关键思想以及性能进行了研究,在此基础上分析和探讨了Apriori Mend算法,并给出了该算法的实现思想和步骤,同时通过实例说明了算法的执行过程,该算法提高了原算法的效率。  相似文献   

12.
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

13.
Apriori算法是挖掘布尔关联规则频繁项集的最有影响的数据挖掘算法之一,但由于数据挖掘本身决定其面临的是海量数据,因此在许多情况下会产生大量候选项集,从而严重影响挖掘的效率。本文提出一种简单有效的Apriori改进算法。  相似文献   

14.
基于Apriori数据挖掘算法研究   总被引:3,自引:0,他引:3  
关联规则是从数据集中识别出频繁出现的属性值集,然后利用这些频繁集创建描述关联关系的规则过程.在分析经典关联规则挖掘算法的基础上,讨论了经典的Apriori算法,并提出改进的Apriori关联规则算法,对算法进行了实验数据的算法性能分析及运行时间对比.结果表明,改进的算法在运行速度和挖掘性能上都较经典的Apriori算法都有显著提高.  相似文献   

15.
Apriori算法的改进   总被引:2,自引:0,他引:2  
针对Apriori算法要多次扫描事务数据库以及生成大量候选集缺陷,在候选集C_1中增加事务标识符列表Tid_list实现只扫描一遍事务数据库,利用频繁项目集的性质来减少生成候选集的数量,提高了算法效率.  相似文献   

16.
对Apriori算法加以改进,提出了一种更高效的关联规则挖掘算法,在扫描数据库的同时把支持每个项目的事务都标记出来,采用一种新的方法来计算候选项目集的支持度.该算法只需对源数据库进行一次扫描,就可以找出所有的频繁集,具有很高的效率.  相似文献   

17.
为充分利用高校教务管理信息、提高高校教学质量、加强学生学习成绩管理,以学生综合数据库为基础,开发基于数据挖掘的高校学生学习成绩预警系统;引入数据挖掘关联规则方法,根据数据类型特点,对学生成绩进行离散化处理;利用Apriori算法对学生课程成绩数据进行关联规则挖掘,预设一定的支持度的条件下,由数据库找出具有一定内在联系和不同可信度的课程成绩作为关联规则;将规则用于学生成绩的预警,有利于对处于危险区的学生提前作出预警通知.该预警系统能够加强教务管理系统的应用,对提高学生学习成绩具有良好效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号