共查询到20条相似文献,搜索用时 62 毫秒
1.
挖掘关联规则中的Apriori算法的研究 总被引:19,自引:1,他引:19
文章是基于大型销售数据库研究了关联规则挖掘问题,分析和探讨了Apriori算法,并给出了该算法的实现思想,同时通过例子说明算法的执行过程。 相似文献
2.
该文通过对Apriori算法的基本思想和性能的研究剖析,认为Apriori算法存在一些不足;并且根据这些不足提出了相应的改进UDApriori算法对经典算法进行优化,从而得到一种改进的Apriori算法,与原算法相比运算效率大大提高. 相似文献
3.
一种基于栈变换的高效关联规则挖掘算法 总被引:12,自引:0,他引:12
在一个模式信息保全引理的基础上,提出了一个基于频繁模式栈变换的关联规则挖掘算法FPST,给出了相应的栈构造和栈变换的算法描述,并进行了算法的性能分析和比较试验,结果表明算法性能优良。 相似文献
4.
5.
基于关联规则挖掘中的Apriori算法,在一定条件下,进行局部改进来提高挖掘的时间效率。这种改进本身并不会需要多大的系统开销,但是可以使算法在某些情况下运行得更快些。 相似文献
6.
一种高效的关联规则挖掘算法研究 总被引:2,自引:1,他引:2
一般关联规则挖掘算法分为两步:第一步是发现频繁项目集;第二步是利用频繁项目集产生关联规则。文章讨论了现今关联规则挖掘算法的特点和不足,同时提出一种效率更高的挖掘算法。与其它算法不同的是,该算法侧重于知识领域的使用和关联规则系统应用的预备。 相似文献
7.
基于改进Apriori算法的关联规则挖掘研究 总被引:2,自引:2,他引:2
关联规则挖掘研究是数据挖掘研究的一项重要的内容。经典的关联规则提取算法——Apriori算法及其改进算法存在着一些不足,一是会产生大量的候选项目集,二是在扫描数据库时需要很大的I/O负载。通过对关联规则产生过程的实际实验分析发现,可以采取利用频繁k-1项集Lk-1对候选k项集Ck进行预先剪枝、及在扫描数据库过程中忽略对频繁项集的产生无贡献的交易记录的方法来改进关联规则提取的效率。 相似文献
8.
9.
一种新的关联规则挖掘的模型 总被引:1,自引:0,他引:1
1.引言 support-confidence模型是正关联规则挖掘普遍应用的模型,而如何度量关联规则的不确定性则是正关联规则挖掘中的重要问题之一。在该模型中,用supp(X∪Y)和conf(X→Y)来度量关联规则X→Y的不确定性。然而,用这一度量标准可能会得到诸如X→Y,但X与Y不相关(或独立)的规则。可见,用conf(X→Y)来度量关联规则是不够的. 实际应用中,我们不仅要挖掘正关联规则,而且还要挖掘负关联规则。正关联规则即形如X→Y的式子,负关联规则即形如X→Y的式子,其中X,YI,X∩Y=,I为数据库D中的所有项的集合,首先看一个例子,若p(c)=0.6,p(t)=0.4,p(t∪c)=0.05,p(t∪c)=0.35,minconf=0.52,有p(t∪c)/p(t)=0.05/0.4=0.125minconf。因此,t→c为一有效规则。 相似文献
10.
关联规则挖掘中对Apriori算法的一种改进研究 总被引:24,自引:0,他引:24
针对Apriori算法寻找频繁项集问题,通过对事务数据库的布尔化表示,提出了一种直接利用布尔矩阵的行向量去搜寻频繁项集的思想。即通过向量的内积运算和判别准则逐步浓缩布尔矩阵的行向量,从而快速、直观地归纳出事务数据库的频繁项集。研究和分析表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有搜索速度快、节省内存空间和处理项目集维数大等优点。对于处理超大型事务数据库和分布式事务数据库,同样也有较好的应用。 相似文献
11.
基于Apriori算法的水平加权关联规则挖掘 总被引:19,自引:2,他引:19
关联规则挖掘可以发现大量数据中项集之间有趣的关联或相关联系,并已在许多领域得到了广泛的应用。目前业界已经提出了许多发现关联规则的算法,这些算法都认为每个数据对规则的重要性相同。但在实际应用中,用户会比较倾向于自己最感兴趣或认为最重要的那部分项目,因此有必要加强这些项目对规则的影响,同时减弱另一些用户兴趣不大或认为不重要的项目对规则的影响。为此,论文提出了水平加权关联规则的问题,并结合Apriori算法,加以改进,给出了关于该问题的解决方案及有效算法New_Apriori。 相似文献
12.
13.
14.
该文在对关联规则挖掘中Apriori算法的深入研究和分析的基础上,发现并指出了该算法存在的不足,并对其进行以下三方面改进:改善候选项集支持度的计算方法;缩小候选项集的生成规模;减少对数据库的扫描次数。实验结果表明.改进算法性能得到了明显提高。 相似文献
15.
该文在对关联规则挖掘中Apriori算法的深入研究和分析的基础上,发现并指出了该算法存在的不足,并对其进行以下三方面改进:改善候选项集支持度的计算方法;缩小候选项集的生成规模;减少对数据库的扫描次数。实验结果表明,改进算法性能得到了明显提高。 相似文献
16.
基于关联规则的数据挖掘技术的快速算法 总被引:11,自引:1,他引:11
提出了一种改进的Apriori算法的数据挖掘模式,探讨了对其中的生成候选频繁项目集、生成强关联规则等几个关健步骤运用标准SQL语言的算法实现。 相似文献
17.
并行关联规则挖掘综述 总被引:3,自引:0,他引:3
关联规则发现作为数据挖掘的重要研究内容,在许多实际领域内得到了广泛的应用。因为在挖掘过程中涉及到大量的数据和计算,高性能计算成为大规模数据挖掘应用的一个重要组成部分。该文介绍了当前并行关联规则挖掘方面的研究进展,对一些典型算法进行了分析和评价,从并行度、负载平衡以及和数据库的集成等方面展望了并行关联规则挖掘的研究方向。 相似文献
18.
一种改进的关联规则挖掘算法 总被引:9,自引:0,他引:9
目前,已经提出了许多挖掘关联规则的算法,其中最著名的是Apriori算法及其变型。这些传统的算法大多存在项集生成瓶颈和难以确定合适的支持度阈值的问题,并且没有考虑数据库的被分析项的各自不同的重要性。为了解决这些问题,该文提出了一种新的关联挖掘算法。 相似文献
19.