首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
基于云计算的Web数据挖掘   总被引:3,自引:0,他引:3  
因特网是一个巨大的、分布广泛的信息服务中心,其上产生的海量数据通常是地理上分布、异构、动态的,复杂性也越来越高,若用已有的集中式数据挖掘方法则不能满足应用的要求。为了解决这些问题,提出了一种基于云计算的Web数据挖掘方法:将海量数据和挖掘任务分解到多台服务器上并行处理。采用Hadoop开源平台,建立一个基于Apriori算法的并行关联规则挖掘算法来验证了该系统的高效性。还提出计算向存储迁移的设计思想,将计算在数据存储节点就地执行,从而避免了大量数据在网络上的传递,不会占用大量带宽。  相似文献   

2.
本文分析了当前网络考试系统数据挖掘现状,介绍了云计算和数据挖掘的相关概念,指出传统数据挖掘技术在当今考试系统海量数据情况下挖掘时系统响应速度慢,负载不均衡和节点效率低的不足,设计了基于Map/Reduce并行编程模型的Apriori算法,利用云计算环境下计算资源来支持该算法的并行执行,通过实例说明云计算化后的Apriori算法在对海量考试数据进行挖掘时能获得更高的挖掘效率。  相似文献   

3.
张旺军 《网友世界》2013,(13):39-40
随着科学技术的不断发展,信息通信行业也进行了快速的发展,其中基于云计算的物联网发展越来越受到人们的重视。下面本文就对基于云计算的物联网数据挖掘模式进行分析,以能够为其发展提供一定的参考资料。  相似文献   

4.
针对目前在搜索方面的数据量大、搜索延迟的特点,提出了基于云计算的Web挖掘的搜索模型.采用提出的基于Map/Reduce模型的改进型算法,通过仿真实验验证了该算法的可行性,在一定程度上减少了搜索的代价,提高了搜索效率.  相似文献   

5.
物联网中的数据具有数据量大、数据类型复杂、高度动态性与异构性、复杂时空特性等特点,为数据挖掘带来新的挑战。传统的数据挖掘方法无法直接应用于物联网之中。基于此,提出一种基于云计算的物联网数据挖掘模型,以云计算作为技术支持平台,在构建面向物联网的分布式时空数据库的基础上,搭建面向物联网海量数据的数据挖掘模型。通过分析表明该模型能够有效地完成物联网中的数据挖掘任务。  相似文献   

6.
张毅  崔晓燕 《软件》2014,(1):108-111
随着社会的不断发展,信息产业已经逐渐成为了国民经济发展的重要支柱,而物联网作为新一代信息技术的重要组成部分成为推动人类文明向智能化方向发展的关键技术。物联网中的数据挖掘是物联网技术中重要的一环,是未来物联网应用数量大规模增长后对物联网产业的强力补充,本文分析了物联网数据的特点以及物联网数据挖掘存在的困难,以及云计算的出现为物联网数据挖掘提供了重要思路,文中论断云计算为物联网提供了最具计算力和存储力的平台,并创新性的提出物联网云的概念。另外,在对平台可行性及性能进行分析的过程中,本文提出了数据转换器、开放平台接口等思路,使整个平台有更好的扩展性,方便第三方开发和测试。目前,物联网应用的整体生态系统面临很多挑战,产业链中的不同人群也面临着不同问题,本文也给物联网中这些问题的解决提供了很好的思路。  相似文献   

7.
《软件》2017,(12):229-232
随着计算机和网络技术的发展,数据挖掘、云计算、物联网等技术在人们生活、工作当中占据着越来越重要的地位。本文分析了物联网、信息融合技术及其应用方法,阐述了以云为中心的物联网数据处理模型,并以城市公共交通出租车数据集为例,描述了数据处理的基本过程,验证了物联网实时数据处理的可行性与可操作性。  相似文献   

8.
网络发达的现今社会,信息产业已经成为国民经济的支柱产业之一。云计算和物联网技术已成为推动人类文明迈向智能化方向发展的核心点,将云计算与物联网技术进行有效融合,能实现海量数据的有效挖掘,对于我国数据挖掘技术的优化与升级有不容小觑的重要意义。  相似文献   

9.
杨雅颂 《物联网技术》2022,(11):128-130
在大数据时代,数据成爆炸式增长状态,加大了数据分析和利用难度。应用数据挖掘技术有助于提高数据分析和利用水平。云计算、物联网技术的出现则有助于深化发展数据挖掘技术。现如今,对三种技术已进行了融合发展,有效提高了数据挖掘技术应用水平。本文主要介绍了物联网、云计算、数据挖掘的概念,分析了基于云计算的物联网数据挖掘技术原理,同...  相似文献   

10.
Hadoop是一个可实现大规模分布式计算的开源软件平台,已经被广泛应用在云计算领域.从Hadoop分布式文件系统的整体架构入手,描述了其分布式数据存储、分布式任务分配、分布式并行计算和分布式数据库四方面的核心内容,并论述了HDFS的工作原理、文件操作流程及Map/Reduce工作原理和计算过程.目的是使开发人员能深入地...  相似文献   

11.
目前,网络中利用数据挖掘技术抽取有效信息成为数据挖掘研究的热点。介绍数据挖掘的流程和分类,并对在云端进行数据的收集和储存提出自己的思想。重点对数据收集的网格和分形维数的聚类算法(GFDC),以及在网络频繁的数据迁移中处理好Master和服务器之间的关系进行了改进。  相似文献   

12.
为了提供虚拟化、高扩展和高性能的并行数据挖掘平台,提出了基于云计算平台的并行数据挖掘模型。文章中首先在GoogleAppEngine平台的基础上扩展了数据规约功能,然后提出了并行数据挖掘平台的系统构架和层次结构,最后给出了平台中各功能模块的具体设计和实现细节。实验分析表明基于云计算平台的并行数据挖掘系统执行效率要比单机系统高,并随着数据量的增大,效率优势越明显。  相似文献   

13.
基于关联规则的数据挖掘技术综述   总被引:4,自引:0,他引:4  
阐述在数据挖掘领域中的四种常用的数据挖掘技术方法,以数据挖掘技术中的关联规则挖掘为基础,阐述关联规则挖掘的经典算法Apriori算法的基本思想。通过关联规则挖掘算法实验给出该算法的具体使用方法,总结该算法存在的不足。  相似文献   

14.
关联规则挖掘是数据挖掘研究中的一个重要方面,而其中一个重要问题是对挖掘出的规则的兴趣度的评估,过去的研究发现,在实际应用中往往很容易从数据源中挖掘出大量的规则,但这些规则中的大部分对用户来说是不感兴趣的,本文对规则的兴趣度度量的两个方面作了讨论:一个是主观兴趣度度量,另一个是客观兴趣度度量,最后介绍了如何利用模板进行挖掘有趣的规则。  相似文献   

15.
基于时序数据的延迟关联规则的挖掘   总被引:5,自引:0,他引:5  
时序数据是一种常见的数据类型,也是数据挖掘的重要研究内容。采用关联规则挖掘时序数据是较新的研究领域。明确提出挖掘延迟关联规则的模型,根据延迟规则的定义提出两种挖掘方法,并针对两种算法进行了相关的对比分析。  相似文献   

16.
李为 《现代计算机》2013,(12):10-13,18
针对网络违法案件侦破过程中存在的海量数据信息无法高效利用的问题,提出采用数据挖掘技术对海量信息中的有效数据进行关联分析。由于常用的关联规则算法Apriori存在多次扫描数据库的缺陷,提出一种基于矩阵的关联规则发现算法。通过运用该算法对数据集中的数据进行分析验证,从而得出在网络违法案件中属性之间的相互关系。  相似文献   

17.
本文根据关联规则和分类规则的概念与表示形式,指出在关联规则挖掘过程中如果指定挖掘与一个确定的项相关联,那么就是分类规则挖掘了,论述了分类规则是特殊情况下的关联规则,并指出在这种特殊情况下,关联规则所具有的特征;然后根据这一论述,提出了一种在关联规则挖掘算法中利用限制条件概率分布来发现分类规则的算法。  相似文献   

18.
并行计算技术与数据挖掘   总被引:1,自引:0,他引:1  
当今社会是信息化高度发达的社会,各类信息汇总形成的数据库也逐渐庞大复杂。因此,在海量的数据中进行数据的查找等工作非常困难。多线程技术虽然在一定程度上可以缓解上述情况,但要想真正做到准确,快速,还是要依靠并行计算技术来实现。本文从介绍数据挖掘以及数据挖掘在Google的应用,引入解决数据挖掘瓶颈问题最有效的方法之一——并行计算。  相似文献   

19.
基于关联规则的教学质量评价数据挖掘   总被引:4,自引:0,他引:4  
课堂教学质量评价是教学质量评估的重要内容,是提高教学质量的重要途径和手段.讨论利用数据挖掘方法中的Apriori算法对教学质量评价数据进行关联规则挖掘,挖掘教学质量与考核对象,考核指标之间的内在关系,为教学管理提供决策支持.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号