首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 125 毫秒
1.
数据挖掘算法广泛地应用于数据分析。工业、科学和商业领域需要分析地理上分布的大量数据集,而网格能有效地提供高性能应用和分布式的基础设施。为了利用网格实现数据挖掘和知识表示,文中根据知识网格的概念,在GlobusToolkit的基础上,分析了知识网格的体系结构和它的主要组件,根据数据挖掘的过程设计了一种网格数据挖掘系统软件模型,并指出了该模型应提供的服务,这些服务会屏蔽所有关于网格底层的所有细节,使最终用户只关心知识发现的过程。  相似文献   

2.
一种网格数据挖掘应用系统的设计   总被引:1,自引:0,他引:1  
数据挖掘算法广泛地应用于数据分析。工业、科学和商业领域需要分析地理上分布的大量数据集,而网格能有效地提供高性能应用和分布式的基础设施。为了利用网格实现数据挖掘和知识表示,文中根据知识网格的概念,在Globus Toolkit的基础上.分析了知识网格的体系结构和它的主要组件,根据数据挖掘的过程设计了一种网格数据挖掘系统软件模型,并指出了该模型应提供的服务,这些服务会屏蔽所有关于网格底层的所有细节,使最终用户只关心知识发现的过程。  相似文献   

3.
科学和工商业应用需要分析分布在各异构站点的海量数据。这就需要合适的分布式并行系统来存储和管理数据。网格为分布式数据挖掘和知识发现提供了有效的计算支持。文中在讨论知识网格体系结构的基础上,利用可视化网格应用环境VEGA实现了基于网格的分布式数据挖掘过程。  相似文献   

4.
胡蓉  肖基毅 《微机发展》2007,17(10):99-101
科学和工商业应用需要分析分布在各异构站点的海量数据。这就需要合适的分布式并行系统来存储和管理数据。网格为分布式数据挖掘和知识发现提供了有效的计算支持。文中在讨论知识网格体系结构的基础上,利用可视化网格应用环境VEGA实现了基于网格的分布式数据挖掘过程。  相似文献   

5.
数据挖掘能帮助理解和发现数据中的隐含信息,然而,由于数据的多源性和地理分布性,传统的数据挖掘技术很难适应虚拟组织参与的复杂方案.文章在陈述数据挖掘与网格研究现状的基础上,提出了网格环境下的三层垂直类数据挖掘体系结构,详细介绍了体系中的各种网格服务内容,阐明了服务的横向与纵向组合形式,并针对该体系结构提出了基于Globus的实施设想.该设计为在网格环境中开展数据挖掘提供了新思路,具体实施则有待深入研究.  相似文献   

6.
在分析科学数据网格环境下数据挖掘之特点的基础上,提出了科学数据挖掘网格服务框架.科学数据挖掘网格服务以网格服务的形式提供了科学数据网格环境下的数据挖掘解决方案.与传统的数据挖掘系统相比,科学数据挖掘网格服务具有诸多优点,更适合科学数据网格和科学数据库环境.目前已经实际应用于几个数据库中,不仅具有简单的查询检索功能,而且可以进行数据统计分析及知识发现,进一步提高了科学数据网格服务的水平.  相似文献   

7.
基于网格的分布式知识发现和挖掘越来越受到学术界的重视。分析了现有的分布式数据挖掘系统的不足,提出了一种基于OGSI.NET的分布式数据挖掘的框架模型,并给出了该模型的软件部署方案。  相似文献   

8.
面向服务的云数据挖掘引擎的研究   总被引:1,自引:0,他引:1  
数据挖掘算法处理海量数据时,扩展性受到制约。在商业和科学研究的各个领域,知识发现的过程和需求差异较大,需要有效的机制来设计和运行各种类型的分布式数据挖掘应用。提出了一种面向服务的云数据挖掘引擎的框架CloudDM。不同于基于网格的分布式数据挖掘框架,CloudDM利用开源云计算平台Hadoop处理海量数据的能力,以面向服务的形式支持分布式数据挖掘应用的设计和运行,并描述面向服务的云数据挖掘引擎系统的关键部件和实现技术。依据面向服务的软件体系结构和基于云平台的数据挖掘引擎,可以有效解决海量数据挖掘中的海量数据存储、数据处理和数据挖掘算法互操作性等问题。  相似文献   

9.
基于网格的分布式数据挖掘   总被引:1,自引:0,他引:1  
针对分布式数据挖掘和网格计算的特点,本文详细分析了目前主流的几种网格体系结构,设计了一种基于开放网格服务架构的Web服务资源框架的分布式数据挖掘整体架构,通过应用描述了它们的具体数据挖掘流程。应用结果验证了该架构在网格环境下进行分布式数据挖掘的可行性和高效性。  相似文献   

10.
基于知识网格的数据挖掘   总被引:8,自引:0,他引:8  
魏定国  彭宏 《计算机科学》2006,33(6):210-213
工业、科学、商务等领域的数据通常分布在不同的地方,需要在不同的地点对其进行分布式维护。只有使用计算功能超强的分布式、并行处理系统才能分析这些领域所产生的超大规模数据集。网格为分布式知识发现应用中的计算提供了有效支持。为了在网格上进行数据挖掘的开发,本文提供了一个称之为知识网格的系统,讨论如何应用知识网格设计实施数据挖掘应用,并说明如何搜索网格资源、编制软件和数据组件,以及数据挖掘应用在网格上的执行过程。  相似文献   

11.
Distributed data mining implements techniques for analyzing data on distributed computing systems by exploiting data distribution and parallel algorithms. The grid is a computing infrastructure for implementing distributed high‐performance applications and solving complex problems, offering effective support to the implementation and use of data mining and knowledge discovery systems. The Web Services Resource Framework has become the standard for the implementation of grid services and applications, and it can be exploited for developing high‐level services for distributed data mining applications. This paper describes how distributed data mining patterns, such as collective learning, ensemble learning, and meta‐learning models, can be implemented as Web Services Resource Framework mining services by exploiting the grid infrastructure. The goal of this work was to design a distributed architectural model that can be exploited for different distributed mining patterns deployed as grid services for the analysis of dispersed data sources. In order to validate such an approach, we presented also the implementation of two clustering algorithms on the developed architecture. In particular, the distributed k‐means and distributed expectation maximization were exploited as pilot examples to show the suitability of the implemented service‐oriented framework. An extensive evaluation of its performance was provided. Copyright © 2011 John Wiley & Sons, Ltd.  相似文献   

12.
吕品  陈年生  董武世 《微机发展》2006,16(10):14-16
元学习方法是采用集成学习的方式来生成最终的全局预测模型。该方法的基本思想是从已经获得的知识中再进行学习,从而得到最终的数据模式。网格能有效地为元学习提供高性能和分布式的基础设施。文中根据知识网格的概念,在Globus Toolkit的基础上,分析了知识网格的体系结构和它的主要组件。根据分布式元学习的一般过程,设计了在知识网格体系结构下的元学习任务。  相似文献   

13.
通用知识网格下以用户为中心的数据挖掘本体研究   总被引:2,自引:0,他引:2  
分布异构的海量数据挖掘是数据挖掘领域急待解决的课题,通用知识网格(UKB)架构模型用于在网格环境下创建大规模的分布式知识发现和知识集成系统。本体服务器是整个架构的核心模块,负责本体的管理和查询。数据挖掘本体服务是本体服务器提供的主要服务。本文主要介绍通用知识网格下以用户为中心的数据挖掘本体的设计和OWL实现。数据挖掘本体可满足各种不同领域、不同层次用户的知识发现服务,使系统具有开放性、可扩展性和高用户可用性。还介绍了一个反洗钱领域数据挖掘解决方案实例。  相似文献   

14.
Distribution of data and computation allows for solving larger problems and executing applications that are distributed in nature. The grid is a distributed computing infrastructure that enables coordinated resource sharing within dynamic organizations consisting of individuals, institutions, and resources. The grid extends the distributed and parallel computing paradigms allowing for resource negotiation and dynamical allocation, heterogeneity, open protocols, and services. Grid environments can be used both for compute-intensive tasks and data intensive applications by exploiting their resources, services, and data access mechanisms. Data mining algorithms and knowledge discovery processes are both compute and data intensive, therefore the grid can offer a computing and data management infrastructure for supporting decentralized and parallel data analysis. This paper discusses how grid computing can be used to support distributed data mining. Research activities in grid-based data mining and some challenges in this area are presented along with some promising future directions for developing grid-based distributed data mining.  相似文献   

15.
该文在介绍网格知识发现概念的基础上,提出了网格知识发现架构设计的基本原则和组件,设计了一种新型的网格知识发现框架,并在此架构上分析了集中式数据挖掘和分布式数据挖掘的全过程,最后给出了工作展望。  相似文献   

16.
一种基于本体和Agent的网格服务发现机制   总被引:1,自引:0,他引:1       下载免费PDF全文
在动态的网格计算环境中分布着大量不同类型的网格服务。快速、准确地进行网格服务发现是影响网格计算性能的关键因素。本文提出了基于本体和Agent的网格服务发现机制,它具有良好的扩展性和完备性。该模型采用Agent代理技术进行服务搜索,不同的代理能够提供不同虚拟组织的本体知识库;利用本体论语义进行服务的匹配,从而实现智能化的服务发现。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号