共查询到20条相似文献,搜索用时 593 毫秒
1.
关联规则挖掘算法中的Apriori算法利用查找频繁项集来发现数据集中的关联规则,算法思路简单容易实现;但在由k-1次频繁项集生成k次频繁项集时需反复查找数据库,效率较低,在寻找高次频繁项集时其低效性更加明显;矩阵算法是通过直接查找高次频繁项集,避免了反复查找数据库,但要存储大量的非频繁项集,且查找低次频繁项集速度较慢。文中提出的矩阵等价类算法,利用等价关系进一步降低矩阵算法的时间空间复杂度,然后通过项目相似度直接求取所有最大频繁项集。实验结果证明了算法的可行性、高效性。 相似文献
2.
3.
4.
5.
挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项集是其中的一个关键步骤.文章提出了一种基于矩阵压缩的Apriori优化算法,并将该算法与Apriori算法进行了比较.实验表明与Apriori算法相比,新算法的效率较好. 相似文献
6.
关联规则挖掘的矩阵算法 总被引:19,自引:0,他引:19
关联挖掘作法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显,文章提出了一种新的关联规则挖掘算法:矩阵算法。同Apriori算法相比较,该算法能直接查找高次频繁项集,可以有效地屏蔽Aptiori算法性能瓶颈试验结果表明,当频繁项级较高时该算法比Apriori具有更高的执行效率和性能,并具有良好的可行性。 相似文献
7.
针对从本文数据集中的正负关联规则挖掘问题,提出一种基于双阈值Apriori算法和非频繁项集的挖掘方法。首先,对通过逆文档频率(IDF)对语料库中的项(项集)进行加权,筛选出前N%的项集。然后,通过提出的双支持度阈值Apriori算法来提取频繁项集和非频繁项集,以此降低非频繁项集的数量。最后,通过置信度和升降度阈值的判断,分别从频繁项集和非频繁项集中挖掘正负关联规则。其中,创新性的利用了非频繁项集来挖掘正负关联规则。在一个医学文本数据集上的实验结果表明,提出的方法能够有效挖掘出正负关联规则,且能够大大降低项集和规则数量。 相似文献
8.
麦丞程 《电脑编程技巧与维护》2015,(11)
设计并实现了一个基于Apriori算法的关联规则挖掘系统.该系统采用Java技术,具有可移植性强、人机交互界面美观、实用性强等优势,可以对频繁项集和关联规则进行挖掘.并对系统进行了测试,发现当数据规模相同时,最小支持度越大,Apriori算法挖掘时间越短;当最小支持度相同时,数据规模越大,Apriori算法挖掘的时间越长. 相似文献
9.
捕要:Apriori算法在关联规则挖掘过程中需要多次扫描事务数据库,产生大量候选项目集,导致计算量过大。为解决该问题,提出一种基于频繁2项集支持矩阵的Apriori改进算法,通过分析频繁k+1项集的生成机制,将支持矩阵与频繁2项集矩阵相结合实现快速剪枝,并大幅减少频繁k项集验证的计算量。实验结果表明,与Apriori算法和ABTM算法相比,改进算法明显提高了频繁项集的挖掘效率。 相似文献
10.
Apriori算法的优化方法 总被引:1,自引:1,他引:0
陈伟 《计算机技术与发展》2009,19(6)
关联规则是数据挖掘的主要技术之一,是指从一个大型的数据集中发现有趣的关联或相关关系,即从数据集中识别出频繁项集,然后再利用这些频繁集创建描述关联规则的过程.频繁项集挖掘是关联规则挖掘的主要步骤,在频繁项集挖掘中,需要大量进行两个操作:判断两个k-项集是否是前k-1项相同且最后一项不同,即连接步;判断一个项集是否为另一个项集的子集,即剪枝步,通过减少连接操作和剪枝操作的循环次数,以此来提高Apriori算法的效率. 相似文献
11.
关系数据库已得到了广泛的应用,研究在关系数据库中挖掘关联规则的有效技术显得越来越重要.在分析关系数据库中关联规则挖掘现有算法的基础上,提出了一种在关系数据库中挖掘量化、多维型关联规则的简易算法.算法应用于安徽科技学院《学生体质健康标准》数据库,结果显示它具有快速、有效、易开发等优点. 相似文献
12.
文章针对普通关联规则不能表达挖掘对象中模糊信息的关联性的问题,给出了一系列有关模糊关联规则的定义,并提出了一种基于关系数据库的模糊关联规则挖掘算法(FARMBT)。实验结果表明,FARMBT算法是有效的。同时,关系数据库的广泛应用使FARMBT算法具有广泛的实用前景。 相似文献
13.
讨论了区间值关系数据库上模糊关联规则的挖掘算法与预测方法。采用一种比RFCM算法省时的FCMdd算法将记录在属性的取值划分成若干个模糊集,并提出区间值关系数据库上模糊关联规则的挖掘算法。仿真实例说明挖掘算法能够通过挖掘有意义的模糊关联规则来发现区间值关系数据库中蕴涵的关联性。区间值关系数据库上模糊关联规则的预测方法改进了标准可加性模型,并通过遗传算法调整模糊关联规则中三角模糊数的参数来提高预测的精度。 相似文献
14.
关系数据库中关联规则挖掘的一种高效算法 总被引:10,自引:0,他引:10
近年来,关系数据库被越来越多的行业采用,大量的生产、管理、科研等信息被收集存储,因此在关系数据库中进行有效的关联规则挖掘的需求日益增强。文中根据事务数据库中布尔型关联规则挖掘的相关理论和方法,在分析了关系数据库中关联规则挖掘具有的特殊性的基础上,从利用结构化查询语言(SQL)对关系数据库简便而高效的操作出发,提出了一种在关系数据库中挖掘多值型、多维型关联规则的简易算法。实验证明该算法具有较高的执行效率和一定的实用性。 相似文献
15.
16.
关联分析是一种重要的数据挖掘技术。文中结合房地产行业的特点,将关联分析方法应用于对消费者购房行为的研究中。传统的关联规则挖掘算法-Apriori算法在实际应用中存在着计算量大、挖掘效率低、产生大量不相关的关联规则等问题。为了减少计算量、提高挖掘效率、发现有价值的关联规则,提出了一种灰色关联度分析算法和Apriori算法结合的研究方法。首先采用灰色关联度分析算法得出影响消费者购房需求和偏好的关键因子,然后采用Apriori算法对关键因子和目标因子之间进行关联规则挖掘。以某市问卷调查的消费者信息记录进行建模,结果表明该关联分析方法具有较高的挖掘效率并且研究结果具有合理性和准确性。 相似文献
17.
关系数据库中的模糊关联规则挖掘算法研究 总被引:2,自引:2,他引:0
关联是数据挖掘领域的一个重要研究课题。对模糊关联规则挖掘进行了研究,针对普通关联规则不能精确表达数据库中模糊信息关联性的问题,提出了一种新的模糊关联规则挖掘算法FARM_New,结果表明算法是有效的,提高了模糊挖掘的速度。 相似文献
18.
基于XML数据的FP-growth算法挖掘研究 总被引:1,自引:0,他引:1
XML是跨平台的数据表示、交换技术,由于其本身在自描述性、开放性等方面的优势,在短短的时间内迅速成为行业标准。大量XML数据的涌现给数据挖掘提出了新的挑战。传统关联规则挖掘是基于关系数据库的,即把XML数据文档映射成关系数据库来完成。给出一个使用FP-growth算法直接从XML文档挖掘关联规则的类接口,并且在J2EE平台下用Java语言实现。 相似文献
19.
基于灰色关联分析的高感兴趣度数据挖掘算法研究 总被引:1,自引:0,他引:1
数据挖掘与知识评价相结合是数据挖掘工作研究的重要方面,也是发挥数据挖掘潜力的重要手段.讨论了数据挖掘和知识评价的结合方式以及灰色关联分析,提出并实现了用灰色关联分析方法构建"感兴趣产生器"并结合关联规则的数据挖掘框架及算法.最后,通过实例证明了该算法挖掘效率高、挖掘效果好,挖掘结果有较高的用户感兴趣度. 相似文献
20.
在分析研究关系数据库上关联规则挖掘现有方法的基础上,提出了一种基于结构化查询语言SQL的多值多层关联规则挖掘新方法。采用了一种新的根据概念分层的编码方法对多值属性进行离散化,然后利用SQL的查询语句,结合多值属性的编码,实现了关系数据库上的多层关联规则挖掘。实验表明,该算法具有快速、有效、易开发等优点。 相似文献