首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 343 毫秒
1.
为了挖掘可疑通信的行为模式,定位发生了可疑通信行为的上网账户,本文首先分析了可疑通信行为特点。然后针对已有关联规则挖掘算法不能同时满足多层次数据挖掘和加权关联规则挖掘的问题,分析对比两种典型的基本关联规则算法,以FP-tree为基础,提出了ML-WFP多层次加权关联规则挖掘算法。针对算法中数据项权重的确定问题,由用户设置数据项间的重要性比较关系,借鉴模糊一致矩阵的概念,利用模糊层次分析法计算数据项的权重。最后将该算法应用于可疑通信行为的挖掘。实验测试结果表明可疑通信行为挖掘方案合理有效。  相似文献   

2.
一种基于多维集的关联模式挖掘算法   总被引:2,自引:0,他引:2  
大多数维间关联规则挖掘算法如基于数据立方体的关联规则挖掘算法都假定对象的属性取值只具有单值性.将对象的属性取值扩展到多值,据此提出多维集的概念和基于多维集关联规则的语义特征.在此语义特征下,提出了一个多维集的关联规则挖掘算法.该算法利用多维集关联规则的限制特征,能够在数据集缩减的同时进行侯选集的三重剪枝,因此,具有比直接使用apriori等算法更好的性能,分析了算法的性能和正确性、完备性,并通过实验对算法有效性进行了对比.  相似文献   

3.
数据流中的关联规则在预测和在线分析系统中有重要应用.现有的研究大多集中在事务数据模型上,鲜有对数据项之间的关联规则挖掘.由于数据的实时性特点,用户又往往对新产生的数据所包含的信息更感兴趣.为了实时而准确地挖掘最近一段时间内数据项间的关联规则,提出了MARSW(mining association rules on sliding window)算法,利用滑动窗口模型对数据流进行关联规则挖掘.MARSW算法在给定的误差范围内,能够有效去除历史数据的影响,并以有限的空间代价快速挖掘大量数据间存在的关联规则.大量仿真实验结果表明,MARSW算法具有较高的效率和优良的可扩展性.  相似文献   

4.
挖掘关联规则的任务是在给定交易集中,每个交易包含一个数据项集,关联发现函数作用在交易集上,返回各数据项集间存在的关系.现实世界中,普遍存在"多级"的概念,在许多应用中,数据项集之间有用的关联规则常常出现在相对较高的概念层中,但在较低概念层往往可以发现较特殊和专门的信息.文中给出了一个在多级概念层上交互挖掘关联规则的算法,并进行了讨论,实验结果表明此算法提高了数据挖掘的效率和速度,并减少了对系统资源的利用.  相似文献   

5.
高丽平  夏敏捷 《微机发展》2004,14(3):104-106
挖掘关联规则的任务是在给定交易集中,每个交易包含一个数据项集,关联发现函数作用在交易集上,返回各数据项集间存在的关系。现实世界中,普遍存在"多级"的概念,在许多应用中,数据项集之间有用的关联规则常常出现在相对较高的概念层中,但在较低概念层往往可以发现较特殊和专门的信息。文中给出了一个在多级概念层上交互挖掘关联规则的算法,并进行了讨论,实验结果表明此算法提高了数据挖掘的效率和速度,并减少了对系统资源的利用。  相似文献   

6.
基于多维数据模型的交叉层关联规则挖掘   总被引:3,自引:0,他引:3  
多层关联规则是带有一定概念分层的关联规更哇,它描述了不同抽象级别上数据项之间的关联性,且不同级别上的关联性具有不同的指导意义.但目前已讨论的多层关联规则,大都局限于挖掘同一抽象层上数据项之间的关联,因而,针对这一问题,本文对已有的FP—Tree算法进行扩充和改进,实现了既能挖掘同一抽象层上也能挖掘不同抽象层上数据项之间关联性的多层关联挖掘算法,即交叉层关联规则挖掘算法FP—Tree*.同时,在算法实施之前,还结合多层关联挖掘本身的特点,对现有的数据存储结构进行改进,提出用字符序列对事务项编码的方法,从而简化了大量的数据预处理工作.  相似文献   

7.
对垂直分布于不同站点的数据进行联合关联规则挖掘是一个重要的研究方向,然而已有的算法挖掘得到的都是全局单维关联规则,不能处理多维数据集并得到全局多维关联规则。针对此问题提出一种数据两方垂直分布条件下的多维关联规则挖掘算法TDDM(Two Part Vertically Distributed Data Mining),该算法结合数据立方体技术,直接在垂直分布于两方的数据上进行挖掘,得到多维关联规则。理论分析和实验结果表明,该算法可以有效挖掘数据两方垂直分布条件下的多维关联规则。  相似文献   

8.
1引言 关联规则是数据挖掘领域中的一个重要课题,挖掘关联规则的算法已经有很多,比较重要的有Rakesh Agrawal等提出的Apriori算法[3],Ramakrishnan Srikant等提出的挖掘定量关联规则的算法,Sergey Brin等提出的DIC算法[5].这些算法都是离线的或者批处理式的,Christian Hidber提出了挖掘关联规则找出数据项频集的在线算法Carma,CharuC.Aggarwal提出了根据数据项频集的集合找出关联规则的在线算法[2],在线挖掘关联规则的算法允许用户随时调整最小支持度(阈值),如果中间结果已经令人满意,用户也可以随时终止算法的执行.  相似文献   

9.
一种新的多维关联规则挖掘算法   总被引:12,自引:0,他引:12  
关联规则是数据挖掘中一个重要课题.文章给出一种基于遗传算法和蚂蚁算法相结合的多维关联规则挖掘算法.新算法利用了遗传和蚂蚁算法共有的良好全局搜索能力,并克服了遗传算法局部搜索能力弱和蚂蚁算法搜索速魔慢的缺陷.实验结果表明,新算法在对具有稀疏特性的多维关联规则的挖掘中体现了良好的性能.  相似文献   

10.
李凯里  王立宏 《计算机工程》2012,38(15):59-61,65
为解决不考虑支持度时关联规则挖掘中数据项集组合爆炸引起的信息湮灭问题,给出全属性项目集、完全关联规则、关联规则的关键前提等概念。证明以关键前提的超集作为前提的关联规则也一定是完全关联规则,即向上闭合特性。根据该原理设计一个能够消除大量冗余关联规则的靶向式关联规则挖掘算法。通过挖掘实例验证了该算法的可行性和有效性。  相似文献   

11.
犯罪行为是刑事案件构成要素的核心,运用关联规则挖掘技术可以发现刑事案件数据中各属性的关联,从而对犯罪行为的相关因素进行分析。文章提出了一种基于SQL语言的面向案件数据中目标属性的多维关联规则挖掘算法,可以避免数据开采关联模型中查找规则的盲目性和冗余性,得出的结果可辅助公安机关进行犯罪信息研判。  相似文献   

12.
关联规则挖掘在煤矿安全监测中的应用   总被引:1,自引:0,他引:1  
李峰  姜丽莉 《软件》2011,32(2):85-86,114
为了从大量的煤矿安全监测数据中获取有用的知识,来指导煤矿安全预警工作,本文将关联规则挖掘算法应用于安全监测数据的数据挖掘。根据数据的特点,对数据进行了预处理后,采用了多维关联规则挖掘算法。文章设计并实现了安全监测数据的关联规则挖掘系统。通过该系统,用户在设置最小支持度和最小置信度阈值后,就可以挖掘出关联规则。  相似文献   

13.
Most incremental mining and online mining algorithms concentrate on finding association rules or patterns consistent with entire current sets of data. Users cannot easily obtain results from only interesting portion of data. This may prevent the usage of mining from online decision support for multidimensional data. To provide ad-hoc, query-driven, and online mining support, we first propose a relation called the multidimensional pattern relation to structurally and systematically store context and mining information for later analysis. Each tuple in the relation comes from an inserted dataset in the database. We then develop an online mining approach called three-phase online association rule mining (TOARM) based on this proposed multidimensional pattern relation to support online generation of association rules under multidimensional considerations. The TOARM approach consists of three phases during which final sets of patterns satisfying various mining requests are found. It first selects and integrates related mining information in the multidimensional pattern relation, and then if necessary, re-processes itemsets without sufficient information against the underlying datasets. Some implementation considerations for the algorithm are also stated in detail. Experiments on homogeneous and heterogeneous datasets were made and the results show the effectiveness of the proposed approach.  相似文献   

14.
针对在关联规则中的Apriori算法进行了深入研究的基础上,提出了一种基于压缩矩阵的关联规则挖掘算法(CMApriori算法)。该算法只需扫描一次数据库,在矩阵上采用事务压缩和项目压缩技术,节省了数据占用的内存空间。在对建立好的压缩矩阵上只需进行简单的计数运算即可得到频繁项集。仿真实验证明:该算法与Apriori算法相比,运算效率大大提高。  相似文献   

15.
基于数据立方体的多维关联规则的挖掘方法   总被引:17,自引:0,他引:17  
高学东  王文贤  武森 《计算机工程》2003,29(14):74-76,153
总结了现有基于数据立方体的多维关联规则挖掘算法,在此基础上将联机分析处理(OLAP)的钻取操作引入关联规则挖掘过程,提出Apriori_cubc算法的改进算法。通过动态调整立方体的维层次,来挖掘出用户感兴趣的关联规则。  相似文献   

16.
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性。通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题。Apriori算法是关联规则挖掘中的经典算法。对Apriori算法做了改进。借助0—1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率。  相似文献   

17.
随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据结构,提出了一种新颖的基于磁盘表的DTRFP-GROWTH(disk table resident FP-TREE growth)算法.该算法利用磁盘表存储FP-TREE,降低内存使用,在传统FP-GROWTH算法占用过多内存、挖掘工作无法进行时,以独特的磁盘表存储FP-TREE技术,减少内存使用,能够继续完成挖掘工作,适合空间性能优先的场合.不仅如此,该算法还将关联规则挖掘和关系型数据库整合,克服了基于文件系统相关算法效率较低、开发难度较大等问题.在真实数据集上进行了验证实验以及性能分析.实验结果表明,在内存空间有限的情况下,DTRFP-GROWTH算法是一种有效的基于磁盘的关联规则挖掘算法.  相似文献   

18.
刘莹  景波  黄兵 《计算机工程》2008,34(13):56-57,6
关联规则的研究目前已经能够从含有缺失值的数据间建立关联性,但缺失值填充的完整性仍显不足。该文利用规则回收技术,以回收组合的方法将已往在挖掘过程中被删除掉的关联规则加以回收利用,从而可以获得更多的关联规则。这种以回收获得的组合式关联规则不仅能够提升缺失值的填充率和正确率,而且可以改进关联规则挖掘方法,降低挖掘时间及空间的复杂度。  相似文献   

19.
数据挖掘过程中只考虑数据项权重或者只考虑时态语义会导致挖掘结果不全面。针对该问题,对加权关联规则、时态关联规则和时态数据周期规律进行研究,将权值、K-支持期望和周期等概念引入到时态关联规则中,提出一种基于周期规律的加权时态关联规则挖掘算法。以某管理系统审计数据为例进行实验验证,结果表明该算法能够准确地挖掘出数据库中的加权时态关联规则,与加权关联规则算法相比,在时间复杂度相同的情况下能使关联规则的挖掘结果更加全面。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号