首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
时态关联规则挖掘是针对在一段时间范围内的关联挖掘,在现实中有较多的应用。现有的大多数时态关联挖掘算法或者需要多次扫描数据库,或者没有考虑各个项在数据集上出现或结束时间上的不同,因而挖掘性能受到较大的制约。为此,本文提出一种增量式的面向具有不同时间出现与结束的项的时态关联规则挖掘算法。为减少存储方面的开销,只需保存已挖掘过的历史数据集中的频繁1项集。为了减少数据的扫描量,通过有效的剪枝策略,有选择性地扫描相关事务项,至多只需扫描一次完整的数据库。实验证明,该算法具有较好的挖掘性能。  相似文献   

2.
时态数据库中增量关联规则的挖掘   总被引:6,自引:0,他引:6  
时态数据库(temporal database)中的时态数据是数据信息中重要的一类,此类数据中存在着大量未知的涉及数据的变化趋势及数据增量之间相互关系方面的知识.给出了时态数据库中的相邻关系(adjacency)和增量(increment)的定义,提出了基于定量属性离散化及编码化的增量关联规则的基本模型(model of discretization & code-based increment association rules);并针对时态数据库中的属性大多为连续定量属性的特性,比较了"部分完备法"(partial completeness)、基于分类信息熵的离散化(entropy-based discretization)、C4.5、基于粗集理论的全局离散化(rough sets-based full discretization)及其改进等多种定量属性的离散化方法,结合定性属性的挖掘算法,提出了具有时间约束的增量关联规则挖掘算法TIDM;最后,讨论了互斥属性集的概念、基本特性及处理互斥属性集的基本方法,对于诸如企业风险管理的管理决策等应用是十分有意义的.  相似文献   

3.
许多现实数据库都存在时态语义问题,因此在挖掘关联规则时附加上时态约束会使规则更具有实际意义。但目前提出的大多数时态关联规则挖掘算法,一般都认为每个数据项的重要性相同,而从决策者角度出发,往往会优先考虑利润较高的项目。提出了一种加权时态关联规则挖掘算法,以项目的生命周期作为时间特征,允许用户设定不同的项目权重。实验结果证明,该算法不仅能有效地发现加权时态关联规则,而且挖掘出的规则更有价值。  相似文献   

4.
关联规则是数据挖掘研究的一个重要分支。阐述了关联规则的基本概念、关联规则挖掘的基本模型;详细分析了关联规则挖掘的经典算法-Apriori算法,Apriori算法核心思想、性能分析及其改进技术。  相似文献   

5.
时态关联规则是指带有时态约束的关联规则,针对现有的大多数时态关联规则挖掘算法并没有考虑数据项的不同重要性,提出了一种新的加权时态关联规则挖掘算法。算法以项目的生命周期作为时间特征,并且允许用户设定不同的项目权重。算法采用了树和矩阵的数据存储结构,挖掘过程中只需扫描一次数据库,同时利用向量之间的交集操作加快了加权支持度的计算速度。仿真实验表明,优化算法具有良好的挖掘效率。  相似文献   

6.
基于兴趣度的时态关联规则挖掘算法   总被引:1,自引:1,他引:1  
关联规则挖掘是数据挖掘研究中的一个重要方面,给出了一个关联规则中事件所包含信息的模型,在此基础上,提出了一种基于兴趣度的时态关联规则挖掘算法。该算法较好地弥补了应用模板匹配方法筛选基于兴趣度的关联规则时主观性太强,兴趣度阈值的定义过于简单,所挖掘出来的关联规则没有体现时态约束的缺陷。最后,将该算法应用到了股票数据的趋势挖掘中,得到了满意的实验结果。  相似文献   

7.
马慧  汤庸  潘炎 《计算机工程》2006,32(17):132-134
随着各种形式的数据的迅速增长,业务数据中的时态信息挖掘问题受到人们普遍关注。该文提出了一种带有效时间区间的时态关联规则,给出了一种基于FP-树的挖掘方法。该方法利用分区挖掘的思想,以分区为单位表示项集的有效时间区间,并为每个分区构建FP-树,大大简化了对某个项集在其有效时间区间中的出现次数的计算,从而更有效地计算时态置信度。最后用一个例子对该方法的执行过程进行了阐述。  相似文献   

8.
信息时代的到来,产生了大量的数据。在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将会创造很多潜在的利润。关联规则的挖掘已被广泛应用在实际生活中。但过去的研究往往认为数据库各个项目的重要程度是相同的,而事实上,用户对项目的看重程度是不同的,因此已有算法挖掘出来的并不一定是我们感兴趣的规则。针对这种情况.提出了加权关联规则。  相似文献   

9.
约束关联规则的有效挖掘算法   总被引:5,自引:0,他引:5  
研究了在大型事务数据库中挖掘有约束条件的关联规则问题;给出院 约束频繁模式树的定义;提出了一种基于约束频繁模式树的约束关联规则挖掘算法-CFPTA,并与其它相应算法进行了比较,实验结果表明算法CFPTA是有效的。  相似文献   

10.
数据挖掘中加权时态关联规则的构造   总被引:1,自引:0,他引:1       下载免费PDF全文
传统的关联规则很少考虑规则的时间适用性,而时态关联规则中每条关联规则都有其成立的时间区域,对上述问题进行了一定的改进。该文在此基础上,构造了一种体现数据时间价值的加权时态关联规则,以使规则的发现体现一种时间趋势,并对同一组数据采用不同关联规则挖掘的结果进行比较,取得了良好的效果。  相似文献   

11.
关联规则挖掘中Apriori算法的研究与改进   总被引:5,自引:0,他引:5  
崔贯勋  李梁  王柯柯  苟光磊  邹航 《计算机应用》2010,30(11):2952-2955
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。  相似文献   

12.
关联规则挖掘Apriori算法的改进   总被引:3,自引:0,他引:3  
在分析研究关联规则挖掘Apriori算法及其若干改进算法的基础上,对Apriori算法做了进一步地改进,提出一种基于条件判断的新思想.改进后的算法根据条件采用了事务压缩与候选项压缩的相结合的方式,减小了不必要的开销,从而提高了挖掘速度.  相似文献   

13.
通过对两种传统的CAD数据到GIS数据转换方法的系统研究,分析了转换过程中存在的信息丢失等问题。基于空间数据关联规则挖掘思想,从问题着手,设计了一种全新的CAD的文本数据到GIS的点层数据的转换方案与挖掘算法。最后,以一个实际的例子,实现了对CAD的文本数据的空间关联规则挖掘,提取文本的坐标信息和属性信息,建立GIS空间数据库,并对转换的几何精度和属性精度进行了评价。  相似文献   

14.
针对规则随着时间变化的特点,在分析原有定义和对支持度向量(SV)和置信度向量分类的基础上,提出了动态关联规则趋势度的挖掘方法。首先,利用趋势度阈值消除无价值的规则,减小候选项集;其次,产生动态关联规则的趋势度元规则,找出具有价值的规则,提高挖掘质量;最后,通过对具有增减和周期趋势的事物数据库分析,证明了所提方法的有效性。  相似文献   

15.
关联规则挖掘是经典的数据挖掘方法,越来越多的企业都把它看作是必不可少的战略分析工具。当前关联规则挖掘方法得到的规则过多,令用户在运用时难以理解,因此研究关联规则集的约简方法具有应用价值。研究了数据库模式中关键字包含的主属性对基于Apriori算法的关联规则挖掘产生的关联规则的影响,即部分函数依赖会导致关联规则挖掘的数据集中冗余信息的频繁出现,并产生没有实际价值的关联规则,识别并消除这样的规则就能实现规则集的约简。求全部主属性如同求所有候选关键字问题都是NP难题,因此提出了一种基于一个候选关键字进行验证的算法来判定主属性,从而完成基于主属性判定的关联规则挖掘约简算法的设计与实现,并在最后的实验中验证了该算法的有效性。   相似文献   

16.
针对安全审计系统中存在的智能程度低、日志信息没有充分利用的问题,提出一个基于关联规则挖掘的安全审计系统。该系统充分利用已有审计日志,结合数据挖掘技术,建立用户及系统的行为模式数据库,做到及时发现异常情况,提高了计算机的安全性。在传统Apriori算法的基础上提出一种改进的E-Apriori算法,该算法可以缩小待扫描事务集合的范围,降低算法的时间复杂度,提高运行效率。实验结果表明基于关联规则挖掘的审计系统对攻击类型的识别能力提升在10%以上,改进的E-Apriori算法相比经典Apriori算法和FP-GROWTH算法在性能上得到了提高,特别是在大型稀疏数据集中最高达到51%。  相似文献   

17.
关联规则挖掘AprioriTid算法的改进   总被引:7,自引:0,他引:7  
提出了一种将AprioriTid算法与事务压缩和项目压缩相结合的改进算法。该算法中候选项目集及支持度计算是在每条事务压缩后通过联接产生,候选项目集采用关键字识别,省去了AprioriTid算法中的剪枝和字符串模式匹配步骤。实验结果表明,改进的算法执行效率明显优于AprioriTid算法。  相似文献   

18.
介绍了假日旅游信息数据挖掘的概念,提出了一种改进的分布式抽样关联规则挖掘算法DS-ARM,给出了算法的实现过程,并对算法性能进行了测试,利用DS-ARM算法对假日旅游者在目的地的旅游行为模式进行了研究。  相似文献   

19.
多层关联规则挖掘算法的研究及应用   总被引:2,自引:0,他引:2  
针对商业银行业务系统中海量数据的分析和研究问题,提出了一种改进频繁项集挖掘算法FP-growth的多层关联规则数据挖掘算法.在对大量商业银行业务交易处理内在规律研究的基础上,依据利润度进行划分,使得该算法在满足用户需求的基础上,有效的缩小了层次结构树的规模,又加快了搜索的速度,从而提高了数据挖掘的效率.模拟算例表明,该算法有效可行,能够更好地适应商业银行交易系统层次结构在大型数据集的数据挖掘.  相似文献   

20.
AR-Markov模型在动态关联规则挖掘中的应用   总被引:1,自引:1,他引:1       下载免费PDF全文
针对规则随着时间变化的特点,为规则建立元规则对其支持度和置信度变化趋势的分析和预测模型。通过增加支持度向量和置信度向量这两种规则评价指标,给出了动态关联规则元规则的形式化定义。利用自回归Markov模型对动态关联规则的元规则进行了挖掘,并通过实例证明了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号