首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
一种改进的加权关联规则挖掘算法   总被引:1,自引:1,他引:0  
基于经典Apriori算法的加权关联规则挖掘算法New-Apriori存在3个问题,需要多次扫描数据库,权值定义不合理和权值的引入导致Apriori基本性质不再成立。为了解决这些问题,采用将矩阵和加权关联规则算法相结合的方法,该改进算法具有只需要扫描一次数据库,权值的定义既考虑到了权重大的项目,也没有忽略频繁出现而权重小的项目,并引入K-项支持期望作为减枝的依据的特点。  相似文献   

2.
文中首先描述了负关联规则的基本概念,接着分析了负关联规则挖掘的特点和相关算法,并提出基于相关性和剪切策略的改进算法来进行正、负关联规则挖掘,最后指出了负关联规则挖掘的研究方向.  相似文献   

3.
Apriori算法是挖掘关联规则频繁项集的经典算法,但需要对数据库进行多次扫描,在交易量较大的情况下,严重地影响了算法效率。本文将改进的遗传算法应用于求解频繁项集,解决了这一问题。实验表明,该算法具有一定的推广价值。  相似文献   

4.
对关联规则挖掘Apriori算法的进一步改进   总被引:4,自引:0,他引:4  
本文对关联规则挖掘问题进行了介绍。并在分析研究了关联规则挖掘Apriori算法厦其若干改进算法的基础上,对Apriori算法做了进一步地改进,提出了RIAprlori算法。改进后的算法采用事务压缩的方法时事务集进行了更大幅度的压缩。减小了不必要的开销,从而提高了挖掘速度。  相似文献   

5.
当前关联规则挖掘主要着眼于正关联规则,如A→B的关联规则的挖掘,这种单一的只对正关联规则的挖掘方式存在严重的弊端,他掩盖了数据之间存在的隐含负关联规则,进而无法得出一些正关联规则中某些项目间相互制约的负关联关系。在关联规则概念和性质的基础上提出了基于频繁模式树的拓展式的正、负项目的关联规则挖掘算法,通过对数据库的遍历形成前缀链表,不仅挖掘包含所有正项目的关联规则,而且还能够挖掘出所有包含负项目的关联规则,不会造成负关联规则的淹没。并对算法的效率和可行性进行分析,该算法在描述关联规则项目间的相互独立程度上比已有的单一挖掘负项目的关联规则算法更具优势。  相似文献   

6.
讨论了一个关于布尔关联规则挖掘的不产生候选项集的挖掘算法 ,做了一些提高算法性能的改进 ,并对其性能进行了测试。  相似文献   

7.
频繁项集挖掘是关联规则挖掘中至关重要的一步。对于稠密数据集的频繁项集挖掘,传统的挖掘算法往往产生大量无用的中间结果,造成内存利用率的极大浪费,尤其是在支持度较低的情况下。Diffsets算法通过引入"差集"的概念,在一定程度上解决了挖掘过程中产生的大量中间结果与内存容量之间的矛盾。改进型Diffsets算法是在原算法的基础上,在差集运算过程中根据差集中所包含的事务标识个数进行递减排序,进一步减少了挖掘过程中产生的中间结果数量。分析与实例表明,改进后的算法在执行过程中将占用更少的内存空间,加快了算法的收敛速度。  相似文献   

8.
单维关联规则快速Apriori算法研究   总被引:5,自引:3,他引:2  
文章通过Apriori和Apriori Tid算法结合生成局部频繁项集,改进了Apriori算法运行速度过慢的问题.再通过程序优化进一步提高了算法运行速度.得到了快速Apriori算法。  相似文献   

9.
引入一种新的加权关联规则支持度和置信度的计算方法,并利用矩阵的存储结构提出一种新的加权关联规则挖掘算法,从而改进了加权频繁项集的挖掘效率.该算法在Apriori算法的基础上,对数据库仅需扫描一次,能很快地计算项集的支持度,大大减少了I/O次数,有效提高了加权频繁项集的生成效率.通过应用于超市捆绑销售,证明了该算法能有效地提取商品间的关联信息,有助于商品的销售.  相似文献   

10.
基于加权关联规则的入侵检测研究   总被引:1,自引:0,他引:1  
提出了采用加权关联规则技术的网络入侵检测系统的结构,将加权关联规则算法应用于入侵模式的挖掘中,在一定程度上提高了入侵检测的检测率,同时使误报率大大降低。  相似文献   

11.
关联规则的开采是数据挖掘中的一个重要问题,其核心是频繁模式挖掘。频繁模式挖掘算法的高效率性近年来是许多学者研究的方向。首先对关联规则挖掘问题进行了描述,其次对一种基于项目可辨识向量及其“与”运算设计的频繁项集快速挖掘算法SLIG进行了分析,最后利用二元关系矩阵及其项之间的二元关系数目,缩减候选频繁k项集的产生,提出了改进算法SLIG*,提高了SLIG算法的效率。  相似文献   

12.
关联规则挖掘Apriori算法的改进   总被引:2,自引:1,他引:1  
在介绍Apriori算法原理和实现过程的基础上,针对该算法存在的两个缺陷,即多次扫描事务数据库和产生大量的候选集,提出新的算法New_Apriori,该算法改变由低维频繁项目集到高维频繁项目集的多次连接运算,直接从1-频繁项目集产生高维频繁项目集,克服了Apriori算法的固有缺点,从而提高了运算效率.  相似文献   

13.
基于数据挖掘的电网故障关联性分析与研究   总被引:1,自引:1,他引:0  
将数据挖掘技术中的关联规则应用到电网故障分析中,从故障数据中发现分类属性与决策属性间的频繁模式、相关性或因果关系,以便从宏观上把握电网故障元素间的关联特性.讨论了关联规则应用于电网故障分析的体系结构及实现的具体步骤,重点对电网故障关联性分析中的频繁项挖掘算法进行了研究,对传统的Apriori算法进行了改进,提出了一种高效的基于数组的类频繁项集挖掘算法.  相似文献   

14.
基于频繁概念格的电子病历关联规则挖掘研究   总被引:3,自引:0,他引:3  
提出了一种基于频繁概念格的FC Lattice电子病历关联规则挖掘算法,该算法在渐进式建格的同时能发现最大频繁项集和提取相应关联规则,并进行基于FC Lattice算法的电子病历挖掘相关实验,结果表明该算法在运行速度和挖掘性能上都是高效的.  相似文献   

15.
为了挖掘医药销售数据库频繁集,采用双数组穷举算法DAEA。该算法主要使用两个数组和穷举算法,实现挖掘医药销售数据库的频繁集功能。该算法的优点是只需对医药销售数据库进行数据预处理就可以直接挖掘该数据库的频繁集,无需把医药销售数据库转换成相应的事务数据库。根据DAEA算法,开发了医药销售数据库频繁集挖掘系统,使用该系统挖掘医药销售数据库的频繁集,挖掘的结果与实际相吻合,说明该算法是可行的和有效的。  相似文献   

16.
关联分析研究的进展   总被引:1,自引:1,他引:0  
关联规则的发现是数据挖掘的一个重要方面,由于信息数据的急剧增长,面对浩如烟海的海量数据,为把这些数据转换成被人类充分利用的有价值信息,对关联规则挖掘算法进行研究就显得异常重要。总结了当今各种关联规则挖掘算法并对其加以分类,阐述了各类关联规则算法的特点,列举算法之间的差异,在时间和空间上进行比较,并且在此基础上对关联规则挖掘的未来趋势进行了分析和展望。  相似文献   

17.
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。  相似文献   

18.
时态约束下的数据挖掘问题及算法   总被引:6,自引:0,他引:6       下载免费PDF全文
毛国君  刘椿年 《电子学报》2003,31(11):1690-1694
对于一个大型数据库而言,为了提高挖掘效率,必须考虑减少数据库的扫描次数,同时使内存需求量保持在一个适当的水平上.把时态约束应用到事务数据库的挖掘中,可以获得更好的效率.本文首先利用时态区间代数操作实现原始数据库的过滤和挖掘时态区间的合并;然后在定义项目序列集操作的基础上,提出一个称为TISS-DM的发现频繁项目序列集的高效算法;最后讨论了这个算法的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号