首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
挖掘最大频繁项集的算法多基于局部数据库,为此提出了一种基于频繁模式树的快速挖掘全局最大频繁项集算法.该算法首先挖掘出所有全局频繁项目组成集合,然后各个节点根据该集合构建局部频繁模式树,最后将该集合作为全局最大频繁候选项集,采用自顶向下策略挖掘出所有的全局最大频繁项集.与类Apriori算法相比,该算法采用的频繁模式树结构能大幅度降低数据库扫描次数和运行时间;自顶向下的策略能大幅度减少候选项集数和通信量.实验结果表明,该算法是快速和高效的.  相似文献   

2.
针对频繁项集挖掘时间与空间效率低的问题,提出一种基于FP-矩阵的高效频繁项集挖掘算法.用此算法构造FP-矩阵压缩事务数据库,无需递归构造条件模式树,仅需3次扫描数据库即可生成所有频繁项集.最后的实验证明了该算法的有效性.  相似文献   

3.
针对频繁项集挖掘时间与空间效率低的问题,提出一种基于FP一矩阵的高效频繁项集挖掘算法。用此算法构造FP-矩阵压缩事务数据库,无需递归构造条件模式树,仅需3次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法的有效性。  相似文献   

4.
针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁项集挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(SNMF),通过提供支持度计数查询和分解储存支持度计数的矩阵,解决了创建条件FP-tree的时空效率低的问题;其次,提出基于遗传算法的分组策略(GS-GA),均衡分配频繁1项集至各节点,解决了节点间的通信开销大的问题;最后,提出高效缩减树结构策略(ERTSS),缩减FP-tree树结构,解决了冗余搜索的问题。实验结果验证了PAFMFI-Spark算法的可行性以及相较于其他挖掘算法的性能优势,所提算法能有效适应各种数据的频繁项集挖掘。  相似文献   

5.
吴卫华  袁宁 《山东机械》2003,(5):44-46,64
本文对数据挖掘中关联规则和序列模式的概念和作用进行了研究,论述了在关联规则中寻找大项集的Apriori算法的实现,以及在序列模式基础上对Apriori算法的结果进行了改进和优化,使数据的关联规则与时间和序列之间建立了密切的联系,从而更好的实现了对于大规模数据库中有用信息的挖掘和利用.  相似文献   

6.
大数据时代信息技术的飞速发展,使得应用数据挖掘分析技术对体育教学评价数据进行分析成为了可能,从而进一步提高教学质量。本文结合传统的Apriori算法的优势,并采用数据分片的模式解决全库扫描本身存在的性能问题,提出了改进的O-Apriori算法,核心在于减少扫描数据库及生成候选集的数量,引入关联度值解决原始算法在获取数据的关联规则不准确的问题,找出体育教学质量评价与教学内容方法KPI因素的关联关系,从而准确定位提升教学质量的关键点,使教师可以有的放矢的调整内容,为改善体育教学提供强有力的数据支撑。  相似文献   

7.
基于关联规则的教务信息挖掘   总被引:1,自引:0,他引:1  
在高校中,教务管理系统每年都产生大量和教学相关的数据,如教师基本信息、学生基本信息、成绩数据及各项测评信息等。这些数据真实的反映了高校的教学情况,但并没有充分利用这些数据来挖掘出有用的决策信息。通过对基于关联规则的教务信息挖掘的研究,把改进的Apriori算法应用在教务信息挖掘中,对影响学生成绩的因素进行分析,确定相互之间的关联规则,以改善教学。  相似文献   

8.
为了解决Apriori关联规则算法在处理大数据时产生大量候选项集,且无法在大数据环境下挖掘出频繁事件中所隐藏的否定关系的问题,通过深度分析事务数据库的特征,结合Boolean矩阵原理,运用粗糙集的分类思想和MapReduce并行编程模型,提出在MapReduce框架下的否定粗糙关联规则算法,以处理大数据所隐藏的否定关系。实验结果表明了该并行算法的有效性,适合挖掘出海量数据的否定关系。  相似文献   

9.
频繁模式挖掘是数据挖掘的核心问题.传统上,频繁模式并行挖掘主要是在集群上进行的,较少涉及共享内存多处理系统上的并行挖掘.基于广度优先搜索和直接计数策略研究了一种并行挖掘方法,并在图形处理器(graphics processing unit, GPU)最新统一计算设备架构CUDA(compute unified device architecture)下进行了实现.GPU-based FPMA用CPU控制搜索进程;在GPU的多处理器上,采用数据划分的计算策略,以适合GPU的顺序数据流方式计数,并根据候选项的长度动态剪枝事务数据集.实验结果表明,GPU-based FPMA比CPU版本平均加速了10倍以上.  相似文献   

10.
介绍了项约束关联规则的基本概念;讨论了三类典型算法,经过比较和分析,给出各算法的优点和不足,同时介绍了项约束关联规则的应用;最后,展望了项约束关联规则挖掘未来的研究方向。  相似文献   

11.
基于数据挖掘技术的远程服务与故障诊断   总被引:6,自引:1,他引:6  
构建一个多制造商和多客户共用一个服务平台的设备远程监测与故障诊断系统,采用现场总线技术采集现场设备状态数据,通过Internet将信息发送到远程服务中心,由不同的工具对信息进行处理,诊断中心采用智能诊断与专家诊断相结合的工作模式,利用关联规则挖掘知识并用于智能诊断,本文阐述了系统网络运行结构,系统功能模型,基于关联规则发现知识的算法以及评价与实现。  相似文献   

12.
提出了基于遗传算法的量化并联规则方法,挖掘起重机状态监测信息数据库中的关联规则。利用该算法对部分数据进行关联规则挖掘,并对发现的规则进行了比较分析,认为关联则反映起重机的机械状态,为评估和预测其机械状态提供信息。  相似文献   

13.
航空机械装备失效分析数据库及数据挖掘技术的应用   总被引:1,自引:0,他引:1  
介绍了航空装备失效分析数据库以及知识发现和关联规则数据挖掘的基本概念和算法,分析了应用数据挖掘方法进行失效分析知识获取的必要性和可行性。结合400个典型失效分析案例,给出了获取失效模式规则知识的应用实例。分析表明:关联规则数据挖掘能够从大量失效数据信息中提取潜在的有用信息和知识,从而为失效分析提供决策支持。  相似文献   

14.
提出了基于数据挖掘技术的远程健康监护系统,针对监护到的海量数据,系统采用数据挖掘技术对用户的多生理参数进行分析处理,并实现报警响应及咨询护理功能。并在此基础上搭建了监护系统的总体结构,软件功能结构的设计与实现,采用Socket实现监护数据的传输。介绍了监护系统的部分关键技术。  相似文献   

15.
基于数据挖掘的电子商务推荐系统,通过使用关联规则算法来对客户的事务执行购物篮分析,知道那些产品比较热销,以及一个特定商品与另一个商品被一起购买的可能性有多大。从而通过商品的推荐和捆绑销售,为客户提供个性化服务,同时实现利益的最大化。在总结前人挖掘模型的基础上,设计了基于Apriori算法的电子商务推荐系统。Apriori算法作为最有影响的挖掘布尔关联规则频繁项集的算法,简单可靠,适合于机器学习。  相似文献   

16.
针对轮胎制造过程质量异常的问题分析,介绍了轮胎质量数据获取、有效整合与数据分析流程,基于Hive数据仓库构建了生产数据与产品检测数据相关联的结构化数据集。针对现有频繁模式增长(FP-Growth)算法存在FP树建树性能较低与大数据处理效率低的问题,提出了一种改进的FP-Growth算法,在原有的频繁项头表基础上新增一个tail属性,加速FP树构建。实验结果表明,改进后的FP-Growth并行算法能够有效提高轮胎质量异常数据的关联分析效率, 能够找出影响轮胎质量的生产制造重要因素,并且适用于大数据量的数据挖掘。  相似文献   

17.
为了减少在计算和存档数据流的过程中对昂贵的存档数据的存取,分析了聚集数据查询的特点,并引入了聚集查询语言和聚集查询重写方法。针对数据流近似查询计算的需求,概述了数据流计算的基本特征,提出了一种基于数据流的近似计算模型。在此基础上,根据实际应用环境给出了一种近似查询提纲的小波方法。该计算架构和方法在人口信息系统中的实际应用表明,可以实现对数据流的快速聚集查询处理,并获得有效的查询结果。  相似文献   

18.
以舰船复杂产品为例,分析了全寿命信息以及与全寿命协同设计及其动态联盟组建过程的相关性。把基于灰关联聚类数据挖掘的数据网格技术应用于设备故障规律的发现,根据舰船全寿命信息共享要求,提出了一个多层次和交叉的、以两个数据网格服务中心为基础的动态联盟共享结构及基于数据挖掘算法的资源和信息发现流程。已开发的原型系统实现了两个数据网格服务中心的信息共享,并用实例验证了用灰色聚类算法来发现某设备的故障规律可行性。  相似文献   

19.
讨论了数据仓库的构建模型和构建过程,以天津市某区统计局系统为例,对数据仓库技术和数据挖掘技术进行了实际应用的研究:即在构建完成数据仓库的基础上,提出了利用Microsoft聚集模型进行数据挖掘,利用逐月用电量数据,分析了电量与企业增加值、月平均气温、营业利润等的相关关系.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号