共查询到20条相似文献,搜索用时 78 毫秒
1.
崇阳 《计算机光盘软件与应用》2014,(9):30-31
随着科技的发展,传统数据处理系统已经远远不能满足人们的需求,云计算以其强大的通用性、大规模的动态扩展、服务的可靠性、低廉的成本、超强的数据存储和处理能力为用户提供优质高效的服务,基于云的数据挖掘平台极大的减少了企业数据挖掘的资金投入,缩短了企业新产品的研发周期,为企业创造了更大的效益。 相似文献
2.
云计算是一种新的用户体验和业务模式,它是在分布式计算的基础上发展而来的,黄河三角洲云计算中心是东营创建智慧城市的积极尝试。介绍云计算的概念、特点和云计算的系统架构,以IBM的云计算技术为例,结合黄河三角洲云计算中心,研究云平台系统架构的关键技术,指出了云计算的发展趋势。 相似文献
3.
云计算是一种以互联网为基础,同时又可以将不同的用户联系起来的技术,并使得相关的服务更好地增加和交付的一种模式,最终的目的是为了给用户提供可靠高效的服务,通常在互联网中提供的是一些虚拟化的资源.如果能够在互联网的运作中更好地引入云计算,那么云计算可以让用户体验10万亿每次的运算能力,这样强大的计算能力可以对我国各行各业的发展带来更大的好处. 相似文献
4.
朱江 《计算机光盘软件与应用》2014,(21):111+113
目前利用云计算进行数据挖掘是海量信息数据处理的热点,云计算以其优越的性能为数据挖掘提供了良好的平台。本文首先介绍了云计算和数据挖掘的相关概念,再从应用的角度阐述了基于云计算的数据挖掘平台的基本架构和功能模块,最后对平台建构中运用的关键技术进行了剖析。基于云计算的数据挖掘平台是当前海量信息处理的研究重点,本文中平台的建构对当前的研究具有重要的实践意义。 相似文献
5.
6.
随着网络技术的飞速发展,不仅给人们生产和生活提供更多有价值的信息,而且又能提升人类从大量数据中发现有价值信息的能力。现阶段,数据挖掘技术已广泛应用在各行各业当中,并且已取得了较好成果。本文主要针对基于云计算的数据挖掘平台架构设计与实现进行了深入探究和分析。 相似文献
7.
陈磊 《电脑编程技巧与维护》2017,(6)
在互联网时代,云计算作为一种时兴的网络技术,具备动态处理、容量高、效率高的特征,在科学研究和商业发展领域都有特别高的应用价值.在数据挖掘平台架构中应用云计算技术,可以给具有海量数据的现代社会提供一个高效率的数据挖掘的技术平台.就基于云计算的数据挖掘平台架构及其关键技术进行了相应的研究. 相似文献
8.
云计算为海量和复杂数据对象的数据挖掘提供了基础设施,为网络环境下面向大众的数据挖掘服务带来了机遇,基于云计算平台已经成为数据挖掘研究的一个重要方向.微软云计算平台是目前推出的较成熟的云计算平台,能够很快的部署云应用程序,该文提出了一种基于微软云计算平台的海量数据挖掘系统. 相似文献
9.
10.
宋秋银 《电脑编程技巧与维护》2013,(8):87-88,91
目前,网络中利用数据挖掘技术抽取有效信息成为数据挖掘研究的热点。介绍数据挖掘的流程和分类,并对在云端进行数据的收集和储存提出自己的思想。重点对数据收集的网格和分形维数的聚类算法(GFDC),以及在网络频繁的数据迁移中处理好Master和服务器之间的关系进行了改进。 相似文献
11.
近年来,计算机科学技术快速发展,在人们的生活、工作和学习中发挥着越来越重要的作用。计算机互联网的信息资源非常丰富,与此同时碎片化、海量的数据信息在很大程度上增加了人们获取有价值信息的成本和时间。当前云计算平台下的Web数据挖掘技术为海量数据信息的处理和分析提供了极大的便利,通过研究云计算平台下的Web数据挖掘,进一步完善和优化Web结构数据挖掘技术,降低大量数据信息存储和处理的成本,提高系统运行效率。本文简要介绍了云计算和Web数据挖掘,阐述了云计算平台下的Web数据挖掘系统。 相似文献
12.
13.
基于MapReduce的海量数据挖掘技术研究 总被引:2,自引:0,他引:2
MapReduce是一种编程模型,可以运行在异构环境下,编程简单,不必关心底层实现细节,用于大规模数据集的并行运算。将MapReduce应用在数据挖掘的三个算法中:朴素贝叶斯分类算法、K-modes聚类算法和ECLAT频繁项集挖掘算法。实验结果表明,在保证算法准确率的前提下,MapReduce可以有效提高海量数据挖掘工作的效率。 相似文献
14.
15.
物联网与云计算是目前信息技术的研究热点,探讨数据挖掘在其中扮演的角色,以及与这2项技术相结合的方式.分析了数据挖掘在物联网中的地位和作用,指出了云计算是物联网的基石,剖析了分布式数据挖掘与并行数据挖掘的异同,说明了物联网中数据挖掘服务的提供方式. 相似文献
16.
传统的数据挖掘模式和方法已经不能适应如今数据的快速增长,分析了将传统数据挖掘算法与云计算技术相结合的实现过程。通过研究云计算环境下海量数据挖掘的三层模型,发现该模型最大的优点是数据挖掘速度快、可靠性高,而且随着数据量的增加,该模型的优势也愈发明显。 相似文献
17.
18.
Distributed data mining implements techniques for analyzing data on distributed computing systems by exploiting data distribution and parallel algorithms. The grid is a computing infrastructure for implementing distributed high‐performance applications and solving complex problems, offering effective support to the implementation and use of data mining and knowledge discovery systems. The Web Services Resource Framework has become the standard for the implementation of grid services and applications, and it can be exploited for developing high‐level services for distributed data mining applications. This paper describes how distributed data mining patterns, such as collective learning, ensemble learning, and meta‐learning models, can be implemented as Web Services Resource Framework mining services by exploiting the grid infrastructure. The goal of this work was to design a distributed architectural model that can be exploited for different distributed mining patterns deployed as grid services for the analysis of dispersed data sources. In order to validate such an approach, we presented also the implementation of two clustering algorithms on the developed architecture. In particular, the distributed k‐means and distributed expectation maximization were exploited as pilot examples to show the suitability of the implemented service‐oriented framework. An extensive evaluation of its performance was provided. Copyright © 2011 John Wiley & Sons, Ltd. 相似文献
19.
Abstract: The computing-intensive data mining (DM) process calls for the support of a heterogeneous computing system, which consists of multiple computers with different configurations connected by a high-speed large-area network for increased computational power and resources. The DM process can be described as a multi-phase pipeline process, and in each phase there could be many optional methods. This makes the workflow for DM very complex and it can be modeled only by a directed acyclic graph (DAG). A heterogeneous computing system needs an effective and efficient scheduling framework, which orchestrates all the computing hardware to perform multiple competitive DM workflows. Motivated by the need for a practical solution of the scheduling problem for the DM workflow, this paper proposes a dynamic DAG scheduling algorithm according to the characteristics of an execution time estimation model for DM jobs. Based on an approximate estimation of job execution time, this algorithm first maps DM jobs to machines in a decentralized and diligent (defined in this paper) manner. Then the performance of this initial mapping can be improved through job migrations when necessary. The scheduling heuristic used considers the factors of both the minimal completion time criterion and the critical path in a DAG. We implement this system in an established multi-agent system environment, in which the reuse of existing DM algorithms is achieved by encapsulating them into agents. The system evaluation and its usage in oil well logging analysis are also discussed. 相似文献
20.