共查询到17条相似文献,搜索用时 46 毫秒
1.
郑晶 《福建建筑高等专科学校学报》2010,(1):83-86
随着信息技术的发展,大量的数据不断被收集和存储,对数据的挖掘规模越来越大,传统的数据挖掘已经无法解决海量数据挖掘问题。网格技术的发展,使得广域分布的海量数据的挖掘问题得到解决。文章根据现实中海量数据挖掘的需求和网格的本质,把并行关联规则挖掘算法应用于网格数据挖掘中,并建立了一个并行数据挖掘模型,验证了并行数据挖掘系统在网格环境的可行性与合理性。 相似文献
2.
提出了一个基于最小完美哈希函数的关联规则的数据挖掘算法。基于Apriori的算法,在综合了传统哈希剪枝技术的同时,利用最小完美哈希函数的优点,保证了静态数据库关联规则挖掘,可以对关联规则的哈希结构数据进行动态的调整。该算法提高了挖掘效率,通过抑制哈希地址冲突提高了算法的稳定性和可用性。 相似文献
3.
4.
基于数据挖掘的决策树算法分析 总被引:1,自引:0,他引:1
杜丽英 《吉林建筑工程学院学报》2014,(5):48-50
决策树是数据挖掘技术中的重要方法,主要用于分类和预测.本文介绍了决策树算法中应用最广泛的ID3算法和C4.5算法,阐述了两种算法的主要思想,说明了构造决策树的基本步骤,对两种算法进行了分析和比较. 相似文献
5.
6.
在研究了基本蚁群聚类模型、信息熵以及几个经典的聚类分析算法的基础上,针对传统K—means算法的不足,首先提出了一种基于信息素的k-means改进算法,该算法以基于信息素的转移概率为判断标准来进行聚类,减少了算法的参数个数,加快了聚类的进程.在深入研究了基于信息熵的LF改进算法的基础上,提出了一种蚁群聚类组合算法策略. 相似文献
7.
8.
独立任务在异构环境下的调度问题已经得到了广泛的研究,已提出了许多启发式任务调度算法,其中包括静态调度算法和动态调度算法.对目前已提出的6种启发式任务调度算法进行了分析和研究,重点介绍了轮循(RR)算法.为了更好的比较这6种算法,采用了一种叫做处理器消耗周期(TPCC)的标准,并通过仿真,将算法进行了性能对比. 相似文献
9.
针对DBSCAN算法时间开销大的缺点,提出了基于网格单元的DBSCAN算法,通过对数据空间进行网格单元划分来优化DBSCAN算法中最耗时的区域查询过程,省去了大量不必要的查询操作,并分析了网格单元的划分方式对本文算法的影响,通过选取最优划分方式,提高整个算法的运行效率。通过仿真实验,验证了基于网格单元的DBSCAN算法具有较高的准确率和较低的时间复杂度。 相似文献
10.
提出了C4.5决策树算法的一种并行算法,使传统的串行分类算法能在多台PC机和服务器组成的数据挖掘网格上并行数据挖掘. 采用数据纵横剖分,结合递归过程的并行化,实现了可扩展的高性能并行计算,解决了处理海量数据时没有较好并行分类算法的问题. 并给出了指导该并行算法高效计算的方法. 数据运行试验和算法分析表明,该并行算法的性能受多个因素影响,并具有高效的并行效率计算加速比. 相似文献
11.
Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,以发现相似客户群体、相关Web页面和频繁访问路径等,其目的在于从用户访问Web系统的行为中发现用户的访问模式.在对Web日志挖掘的原理和技术进行讨论的基础上,重点探讨了如何将Apriori改进算法应用于对Web日志的挖掘,提出了一种基于该算法的Web日志挖掘实现方法,实验结果表明了算法的有效性. 相似文献
12.
Web日志挖掘数据预处理方法研究 总被引:1,自引:0,他引:1
Web日志挖掘通过分析Web服务器的日志文件发现用户访问站点的浏览模式,预处理是保证高效、快速地挖掘到正确、有用的模式最为关键的环节.笔者分析了数据预处理的具体过程,并对数据预处理方法进行了深入的研究. 相似文献
13.
介绍了数据挖掘技术的相关概念,结合电力系统的特点,分析了数据挖掘在电网企业中应用的必要性,给出了数据挖掘在电网企业中的具体应用方向. 相似文献
14.
基于Web日志挖掘的智能站点体系 总被引:4,自引:0,他引:4
Web日志挖掘是通过分析Web服务器的日志文件,以发现用户访问站点的浏览模式,为站点管理员提供各种利于Web站点改进或可以带来经济效益的信息。在分析了Web日志挖掘主要特点之后,提出了一个可行的面向Web日志挖掘的智能站点结构,并给出了一个架构于Apache服务器上的智能站点原型。 相似文献
15.
侯枫 《河南纺织高等专科学校学报》2008,(3)
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式. 相似文献
16.
1 Introduction Grid is a distributedcomputing platform com - posed of a group of heterogeneouscomputers which distributeidndifferenatreas,theuserscan accessand gettheservicesthrough a uniform interfac.eData grid arisingfrom the normal grid system,is devot… 相似文献
17.
基于遗传算法的数据挖掘技术应用 总被引:10,自引:0,他引:10
本文对数据挖掘进行了概述,阐明了数据挖掘的概念、数据挖掘在商业中的意义.提出了数据挖掘技术中的一个重要算法——遗传算法的基本原理以及遗传算法在数据挖掘技术中的地位.结合大型商场管理系统提出了一种基于遗传算法的最优客户群体数据挖掘算法,以实例说明了应用遗传算法中需要注意的一些问题,并讨论了数据挖掘技术所面临的问题和挑战. 相似文献