首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
改进Apriori挖掘算法的网格实现   总被引:2,自引:0,他引:2  
殷剑锋  徐建城  李伟强 《计算机仿真》2010,27(2):145-148,268
科学和工商业应用需要分析分布在各异构站点的海量数据。传统的关联规则挖掘算法探讨的对象基本上都是集中式的数据集,对分布式的动态数据库群无能为力,因而迫切需要对分布式数据挖掘算法进行研究探讨。在研究OGSA面向服务的体系结构基础上,将网格技术与数据挖掘技术有机地结合在一起,提出了一种基于网格的分布式关联规则挖掘方法。是改进Apriori挖掘算法在网格环境下的具体应用。仿真实验表明方法具备网格的并行挖掘特性,能够成功实现位于多个异构站点E的分布式数据挖掘,且挖掘速度和运算效率较之集中式Apriori挖掘算法有较大幅度的提高。  相似文献   

2.
胡蓉  肖基毅 《微机发展》2007,17(10):99-101
科学和工商业应用需要分析分布在各异构站点的海量数据。这就需要合适的分布式并行系统来存储和管理数据。网格为分布式数据挖掘和知识发现提供了有效的计算支持。文中在讨论知识网格体系结构的基础上,利用可视化网格应用环境VEGA实现了基于网格的分布式数据挖掘过程。  相似文献   

3.
科学和工商业应用需要分析分布在各异构站点的海量数据。这就需要合适的分布式并行系统来存储和管理数据。网格为分布式数据挖掘和知识发现提供了有效的计算支持。文中在讨论知识网格体系结构的基础上,利用可视化网格应用环境VEGA实现了基于网格的分布式数据挖掘过程。  相似文献   

4.
广域网中存在地理上分布的海量的各种数据,分析和处理这些数据需要利用高性能的分布式并行处理系统,网格能够满足这种要求.知识网格就是使用基本的网格服务(通信服务、信息服务、授权服务和资源管理服务)去建立特定的分布式并行知识发现工具和服务.结合知识网格特点,讨论了知识网格的体系结构和支持知识挖掘应用的服务集.运用分布式数据挖掘的元学习模型,给出了利用知识网格提供的知识挖掘服务实现分布式数据挖掘的过程.  相似文献   

5.
随着信息技术的不断发展,传统的主要面向集中的数据源的数据挖掘系统已经不能满足时代发展的需要,web分布式数据挖掘技术应运而生,作为新兴的数据挖掘技术,建立了分布式计算平台,解决了传统数据挖掘技术中常见的操作困难、效率低、传输过程中安全性不能得到保证等问题。在web服务的基础上建立的分布式数据挖掘体系,可以挖掘出分布式异构环境下的大量数据,并且对数据隐私保护起着重要的作用。这样不仅使分布式数据挖掘系统处理大规模分布式异构数据得到用户的满足,也大大提高了系统的安全性、可扩展性、可交互性等。本文内容主要涉及到web服务、web挖掘技术的概念、于Web服务的分布式数据挖掘体系结构。  相似文献   

6.
分布式数据挖掘是数据挖掘领域的一个新兴研究课题,而其主要问题是知识共享和软组件重用.结合Web服务技术的跨平台、统一数据表示格式以及可实现软组件重用和数据重用等优点,文中提出了一种基于Web服务的分布式数据挖掘体系,可实现分布式异构环境下的大容量数据的数据挖掘,旨在对异构数据库的数据挖掘进行一些有意义的探讨.  相似文献   

7.
研究大云数据快速挖掘优化控制问题.在大云数据环境下,产生的海量数据通常是地理上分布、异构、动态的,复杂性也越来越高,若用传统的集中式云计算算法对数据进行挖掘处理,会使算法陷入无穷对比的境地,造成算法不收敛,复杂度高的弊端.为解决上述问题,提出了一种并行Apriori算法的大云数据挖掘方法.对大云数据进行简化处理,去除其中的冗余数据,为大云数据快速挖掘提供数据基础.计算大云数据中的关联规则,从而获取大云数据之间的相关性.对大云数据进行处理,实现大云数据挖掘.实验结果表明,利用改进算法进行大云数据挖掘处理,能够有效提高数据挖掘的速度,存在较强的优越性.  相似文献   

8.
移动互联网正在给信息产业带来一场深刻的变革,移动计算将成为主流计算环境.数据挖掘技术已经成为一种将巨大数据资源转换成有用知识和信息资源,帮助我们进行科学决策的有效工具.本文分析了移动计算环境下数据挖掘技术的发展,包括发展方向和关键技术;给出了移动计算环境下的数据挖掘系统的模型和实现流程;提出了移动车辆数据流实时监视与挖掘系统的实现方案.基于移动计算的数据挖掘有效地解决了对异构数据库和全球信息系统的信息挖掘问题,它必将在新一轮的技术竞争中成为持续发展的增长点.  相似文献   

9.
基于Mobile Agent的分布式ID3挖掘模型   总被引:2,自引:0,他引:2  
随着Internet的发展,网络上的数据具有空问分布、环境和内容异构、结构复杂、相互关联强等特性,如何快速有效地从分布式存储的海量数据源中挖掘信息是分布式数据挖掘要解决的问题。针对传统决策树ID3算法的缺陷,提出分布式ID3算法,结合mobile agent技术,提出了基于mobile agent的分布式ID3挖掘模型,并进一步用数据集验证模型。  相似文献   

10.
一种基于Web服务的分布式数据挖掘体系结构   总被引:4,自引:0,他引:4  
分布式数据挖掘是数据挖掘领域的一个新兴研究课题,而其主要问题是知识共享和软组件重用。结合Web服务技术的跨平台、统一数据表示格式以及可实现软组件重用和数据重用等优点,文中提出了一种基于Web服务的分布式数据挖掘体系,可实现分布式异构环境下的大容量数据的数据挖掘.旨在对异构数据库的数据挖掘进行一些有意义的探讨。  相似文献   

11.
分布在因特网上的物流资源具有地理分散和职权自治的特性,资源结构和接口难以统一。该文以网格、Agent和增量挖掘技术为基础,提出了不通过资源整合就能够实现全局信息挖掘的方法。分析了基于Web的物流资源网格系统,将其划分为物流域的集合实施分级管理。提出了新的面向网格的信息挖掘模型并设计了域内动态资源挖掘算法和域间请求式资源挖掘算法。该模型解决了不同物流系统之间的信息挖掘难题,算法中引入的增量挖掘技术提高了域间资源挖掘效率。  相似文献   

12.
网格技术的发展使网格数据挖掘成为处理分布异构海量数据的重要手段。该文将本体引入到网格数据挖掘中,讨论了网格数据挖掘本体的结构,并提出了网格数据挖掘本体的建立过程,最后讨论了网格数据挖掘本体实现。  相似文献   

13.
网格技术的发展使网格数据挖掘成为处理分布异构海量数据的重要手段。该文将本体引入到网格数据挖掘中。讨论了网格数据挖掘本体的结构,并提出了网格数据挖掘本体的建立过程,最后讨论了网格数据挖掘本体实现。  相似文献   

14.
The growing computerization in modern knowledge and technology sectors is generating huge volumes of electronically stored data. Data mining technology is often employed to make sense of these data. However, as modern data mining applications increase in complexity, so do their demands for resources. Grid computing is one of several emerging networked computing paradigms promising to meet the requirements of heterogeneous, large-scale and distributed data mining applications. Despite this promise, there are still too many issues to be resolved before grid technology is commonly applied to large-scale data mining tasks. To address some of these issues, we developed the DataMiningGrid system, which principally differs from similar systems by its ability to integrate a diverse set of programs and application scenarios within a single framework. The system's key features include high performance and scalability, sophisticated support for relevant standards, different user types, and flexible extensibility. The software is available as open source.  相似文献   

15.
网格的数据挖掘*   总被引:24,自引:2,他引:22  
网格是网络计算、分布式计算和高性能计算技术研究的热点。随着科学计算领域中的数据剧烈增长以及未来网格计算环境下广域分布的海量数据共享成为现实,数据挖掘技术将在挖掘有效的信息、发现新的知识和规律发挥着重要的作用。结合网格的特点,概述了网格数据挖掘的特点和关键技术,重点讨论了网格数据挖掘的体系结构和基本过程,最后给出了基于OGSA的网格数据挖掘的例子。  相似文献   

16.
基于SPRINT分类算法的异构分布式数据挖掘研究   总被引:3,自引:0,他引:3  
分类算法是数据挖掘领域最重要的技术之一。随着网络的迅猛发展,分布式环境的日益普遍,分布式数据挖掘已成为近年来数据挖掘中的热点问题。针对目前的数据库多为异构式分布,提出利用SPRINT算法来进行分布式环境下的分类研究。先简要介绍了SPRINT算法,然后针对具体实例,详细探讨了分站点的预处理、计算最佳分裂、中心站点的决策树生成等几个阶段以及具体的算法设计实现过程。  相似文献   

17.
数据挖掘工作面临一个问题:由于数据挖掘任务需要处理大规模数据,导致任务执行时间过长。网格计算的研究目标就是将分散的、异构的、闲置的计算机结合为一个高性能的计算机系统,因此可以利用网格系统提供的高性能计算能力来有效降低数据处理时间。提出并实现基于网格计算的数据挖掘系统——DMGrid。重点考虑了并行计算功能,同时考虑了网格计算资源的动态配置。和现存的数据挖掘网格不同的是,DMGrid提供了一个引擎来执行应用中设定的工作流,同时还提供了应用运行监控功能。最后在实验中通过设计两个应用程序(客户流失分析和客户价值分析),证明了DMGrid的可行性。  相似文献   

18.
基于知识网格的数据挖掘   总被引:8,自引:0,他引:8  
魏定国  彭宏 《计算机科学》2006,33(6):210-213
工业、科学、商务等领域的数据通常分布在不同的地方,需要在不同的地点对其进行分布式维护。只有使用计算功能超强的分布式、并行处理系统才能分析这些领域所产生的超大规模数据集。网格为分布式知识发现应用中的计算提供了有效支持。为了在网格上进行数据挖掘的开发,本文提供了一个称之为知识网格的系统,讨论如何应用知识网格设计实施数据挖掘应用,并说明如何搜索网格资源、编制软件和数据组件,以及数据挖掘应用在网格上的执行过程。  相似文献   

19.
基于虚拟集中方法的异构分布式数据集成模型   总被引:15,自引:1,他引:14  
网络和信息技术的发展导致新的数据格式不断涌现,数据整合的要求日益迫切,为此提出一个基于虚拟集中方法实现的异构数据集成模型,可以实现分布、异构数据的一致性访问,并能保证数据的一致性、实时性和数据源的“即插即用”,较好地解决了异构数据源的联合使用问题。最后给出了基于Java和XML技术的基本实现方法。  相似文献   

20.
建立在网格基础上的数据挖掘结合了网格技术的优点,能够对各种信息载体中分布的海量信息进行高效的处理、分析和挖掘。本文分析了网格技术与聚类分析方法的特点,使用基于网格方法的数据分析方法将空间划分为由(超)矩形网格单元组成的网格,然后在网格单元上进行聚类分析,以达到更加深入的进行数据挖掘分析之目的,  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号