共查询到19条相似文献,搜索用时 406 毫秒
1.
一种新的改进的Apriori算法 总被引:2,自引:0,他引:2
本文通过时关联规则挖掘算法Apriori算法的分析和研究,指出了其在具体应用中存在的主要问题.提出与以往不同的改进策略:在约简数据库事务的同时,生成频繁项目集和保存具有非频繁子集候选项目集的项集,在提高频繁项目集即关联规则生成效率的同时,进一步减少了对候选项目集的重复验证.最后将改进的Apriori算法应用到一个Web交叉销售系统,并和经典的Apriori算法进行了比较,取得了较好的效果. 相似文献
2.
Apriori算法是数据挖掘领域挖掘关联规则频繁项目集的经典算法,但该算法存在产生大量的候选项目集及需要多次扫描数据库的缺陷。为此提出一种新的挖掘关联规则频繁项目集算法( CApriori算法):利用分解事务矩阵来压缩存放数据库的相关信息,进而对分解事务矩阵进行关联规则挖掘;优化了由频繁k -1项目集生成频繁k项目集的连接过程;提出了一种不需要扫描数据库,利用行集“与运算”快速计算支持数的方法,改进算法挖掘所有的频繁项目集只需扫描数据库两次。实验结果表明,改进算法在最小支持度较小时效率高于Apriori算法。 相似文献
3.
关联规则是数据挖掘的重要内容之一。为了高效、快速地从事务数据库中挖掘出频繁项目集,针对数据挖掘的经典关联规则Apriori算法的瓶颈问题提出了改进的方法。通过对基于数组的Apriori算法的改进,只扫描一次数据库,在生成候选频繁项目集前进行判断,减少非频繁的候选的项目集的生成,并通过减少数组数据的扫描和不断压缩数组,提高了算法的运行效率,节约了开销。 相似文献
4.
关联规则挖掘中Apriori算法的研究与改进 总被引:5,自引:0,他引:5
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 相似文献
5.
6.
基于Apriori算法的改进算法 总被引:2,自引:0,他引:2
关联规则挖掘是数据挖掘研究的一项重要内容.为了快速挖掘关联规则,分析了挖掘关联规则的Apriori算法,并在此基础上给出了一种改进的算法:NApriori算法,利用频繁1项集重新组织事务数据库来挖掘关联规则,此方法仅需扫描数据库2次,且避免了Apriori算法繁琐的连接和删除步骤,实验结果表明此方法比Apriori算法有更好的性能. 相似文献
7.
捕要:Apriori算法在关联规则挖掘过程中需要多次扫描事务数据库,产生大量候选项目集,导致计算量过大。为解决该问题,提出一种基于频繁2项集支持矩阵的Apriori改进算法,通过分析频繁k+1项集的生成机制,将支持矩阵与频繁2项集矩阵相结合实现快速剪枝,并大幅减少频繁k项集验证的计算量。实验结果表明,与Apriori算法和ABTM算法相比,改进算法明显提高了频繁项集的挖掘效率。 相似文献
8.
9.
李红 《数字社区&智能家居》2006,(32)
改进频繁项集算法的效率是提高关联规则挖掘性能的重要环节,本文提出了基于包含频繁1-项集的事务集的关联规则挖掘算法,并通过实例说明了算法的有效性,且与Apriori这一经典算法作了比较。 相似文献
10.
关联规则挖掘算法及其应用研究 总被引:13,自引:1,他引:13
本文提出了一种适用于数字资源访问日志数据库的关联规则挖掘改进算法,它采用事务压缩和项目压缩相结合,而候选项目集及支持度计算是在每条事务压缩后通过联接产生,候选项目集采用关键字识别,省去了Apriori算法中的剪枝和字符串模式匹配步骤,可快速得到完整的频繁模式集。该算法特别适用于数字图书馆海量数字资源的个性化信息需求获取分析。 相似文献
11.
12.
Apriori算法在红外光谱数据挖掘中的应用 总被引:1,自引:0,他引:1
简要地介绍了在大规模数据库中挖掘关联规则的Apriori算法 ,给出了红外光谱数据库知识发现的空间表示方法 ,并根据红外光谱数据挖掘的特点改进了Apriori算法中支持度的计算与频繁集的确定过程 ,运用统计方法把挖掘结果形成可视的特征谱带 -化学基团规则式 ,通过具体的挖掘事例对挖掘结果进行分析与评价。挖掘出的规则式和波谱分析理论比较结果证明了挖掘结果的正确性 ,说明改进过的Apriori算法挖掘红外光谱数据库的有效性 相似文献
13.
该文在对关联规则挖掘中Apriori算法的深入研究和分析的基础上,发现并指出了该算法存在的不足,并对其进行以下三方面改进:改善候选项集支持度的计算方法;缩小候选项集的生成规模;减少对数据库的扫描次数。实验结果表明,改进算法性能得到了明显提高。 相似文献
14.
通过对关联规则挖掘技术及经典算法Apriori和FP-growth的研究和分析,提出了一种改进的频繁项集挖掘算法。该算法利用矩阵存储数据,并结合矩阵运算求项集的支持数,有效减少了事务数据库的扫描次数;利用有序频繁项目邻接矩阵创建频繁模式树,有效减少了频繁模式树的分支和层数。通过实例分析了频繁项集的挖掘过程。 相似文献
15.
16.
17.
该文在对关联规则挖掘中Apriori算法的深入研究和分析的基础上,发现并指出了该算法存在的不足,并对其进行以下三方面改进:改善候选项集支持度的计算方法;缩小候选项集的生成规模;减少对数据库的扫描次数。实验结果表明.改进算法性能得到了明显提高。 相似文献
18.