首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 104 毫秒
1.
在这个信息量爆炸的年代,大数据越来越贴近我们的生活。论文从大数据从何而来、如何研究大数据入手,通过对大数据分析流程框架进行阐述,提出了大数据分析中关联挖掘的重要性。并通过对大数据关联挖掘给出了相应的研究方案,通过系统对其关联模式进行分析,同时也可通过人为的参数选择对研究的参数进行分析、筛选和保留。在大数据分析的过程中,若能很好地利用关联规则的挖掘,将会带来更广阔的实际价值。  相似文献   

2.
伴随着互联网技术的发展以及推广运用,人类逐渐步入到信息时代.在这样的背景之下,数据信息呈现出爆炸式的增长趋势,并对各行业的发展起到了一定的促进作用.目前,我国的各行业在发展战略制定的过程中加强了对于各类数据信息的运用,为了实现各类纷繁复杂数据得到充分分析以及利用,需要相关部门加强数据分析以及处理,进而实现了对于大数据的挖掘,提升相关资源的利用效率.  相似文献   

3.
大数据分析     
陈明 《计算机教育》2014,(5):122-126
大数据分析是大数据技术的主要应用之一。文章介绍大数据分析的基本方法、类型、步骤、内容和预测分析等。  相似文献   

4.
当大数据分析逐渐成为主流时,它将会变得和其他早期的技术一样普遍,大数据分析也会逐步成为一种日常工具。文中分析了大数据分析面临的主要挑战,以及数据从累积到分析的分析学体系,同时分析了大数据分析市场的未来趋势,给出了大数据分析的关键还在于人为操作的结论。  相似文献   

5.
在大数据时代,需要充分挖掘数据的隐藏价值,对数据加强分析.为了完整正确地反映客观情况,就必须在实事求是的原则下,经过对大量的统计资料和数据进行加工制作和分析研究,才能做出科学判断,并编写成数据分析报告.  相似文献   

6.
大数据分析与高速数据更新   总被引:1,自引:0,他引:1  
大数据对于数据管理系统平台的主要挑战可以归纳为volume(数据量大)、velocity(数据的产生、获取和更新速度快)和variety(数据种类繁多)3个方面.针对大数据分析系统,尝试解读velocity的重要性和探讨如何应对velocity的挑战.首先比较事物处理、数据流、与数据分析系统对velocity的不同要求.然后从数据更新与大数据分析系统相互关系的角度出发,讨论两项近期的研究工作:1)MaSM,在数据仓库系统中支持在线数据更新;2)LogKV,在日志处理系统中支持高速流入的日志数据和高效的基于时间窗口的连接操作.通过分析比较发现,存储数据更新只是最基本的要求,更重要的是应该把大数据的从更新到分析作为数据的整个生命周期,进行综合考虑和优化,根据大数据分析的特点,优化高速数据更新的数据组织和数据分布方式,从而保证甚至提高数据分析运算的效率.  相似文献   

7.
大数据是IT领域的一个专业术语,大数据是指无法在规定的时间内使用常规的软件和工具将数据信息进行整理和归纳,需要使用心得处理方式进行分析的一种信息处理方式。随着互联网行业的高速发展,人们对数据的利用率和需求也逐渐增加,传统的信息数据处理方式在网络和经济高速的今天已经很难得到满足,如何更加迅速有效的将数据进行分析整理成为互联网行业时刻关注的问题。本文就在大数据时代下五河更加快速有效的进行数据分析作出以下分析,望对互联网行业从业者能够起到帮助。  相似文献   

8.
相对于软硬件一体的企业级数据仓库解决方案,以X86开放式硬件平台为基础的并行处理数据库和Hadoop/Spark生态体系,在扩展性和低成本方面有明显的优势,随着其不断发展成熟,已经成为企业级大数据平台不可或缺的一部分.本文从如何应对“大数据”所带来的挑战出发,提出一套适用于大型商业银行数据分析处理的融合大数据技术架构,并已取得应用实践的成功.  相似文献   

9.
全面论述了大数据分析技术的概念、现状、技术及应用,包括大数据基本概念及特点、大数据分析产生的时代背景、关键技术以及大数据带来的变革和挑战,在大数据分析的关键技术中重点对大数据的清洗与融合、大数据处理框架、大数据的建模与分析进行了介绍。  相似文献   

10.
大数据分析中的计算智能研究现状与展望   总被引:2,自引:0,他引:2  
郭平  王可  罗阿理  薛明志 《软件学报》2015,26(11):3010-3025
随着产业界和科学界数据量的爆炸式增长,大数据技术和应用吸引了众多的关注.如何分析大数据,充分挖掘大数据的潜在价值,成为需要深入探讨的科学问题.计算智能是科学研究和工程实践中解决复杂问题的有效手段,是人工智能和信息科学的重要研究方向,应用计算智能方法进行大数据分析具有巨大的潜力.对大数据分析中的计算智能方法进行综述,结合大数据的特征,讨论了大数据分析中计算智能研究存在的问题和进一步的研究方向,阐述了数据源共享问题,并建议利用以天文学为代表的数据密集型基础科研领域的数据开展大数据分析研究.  相似文献   

11.
在对网页数据进行爬取时,由于很多网页不是静态的HTML文档,而是包含很多JavaScript程序,使用传统的爬虫方法不能有效地获得所需要的信息,采用Selenium模拟浏览器访问网站的方法以及Python语言对拉勾网中大数据相关岗位数据进行了爬取,并且对大数据开发工程师、大数据研发工程师以及大数据架构师这三个岗位中岗位的任职要求数据进行了分析,用词云进行了展示,可以为数据科学与大数据技术专业培养方案的制定以及相关课程授课学时的设计提供一定的依据。  相似文献   

12.
过程工业大数据建模研究展望   总被引:18,自引:14,他引:18  
刘强  秦泗钊 《自动化学报》2016,42(2):161-171
人们对大数据的认识已从"3Vs" (Volume-大容量; Variety-多样性; Velocity-处理实时性)、"4Vs" ("3Vs"与Value-价值)、到现今的"5Vs" ("4Vs"与Veracity-真实性).在此背景下, 首先分析过程工业大数据的"5Vs"特性; 接下来, 综述现有数据建模方法, 并结合过程工业大数据特有性质 (包括:多层面不规则采样性、多时空时间序列性、不真实数据混杂性) 论述现有数据建模方法应用于工业大数据建模时的局限; 最后, 探讨过程工业大数据建模有待研究的问题, 包括:1) 多层面不规则采样数据的潜结构建模; 2) 用于事件发现、决策和因果分析的多时空时间序列数据建模; 3) 含有不真实数据的鲁棒建模; 4) 支持实时建模的大容量数据计算架构与方法.  相似文献   

13.
虽然基本的Web分析工具非常普遍,目前的分析工具只分析页面级别的用户交互,为了加深对用户行为的理解,该研究提出了将Web应用程序与运行时日志相结合的方法.实现对web应用程序的日志以及用户与页面的交互的跟踪,达到了基于大数据的用户行为分析和可视化.  相似文献   

14.
作为电网企业对外服务窗口,电网客户服务中心需要整合企业内部各种异构数据资源、存贮和分析海量的客户服务语音信息和 WEB 服务信息。如何对电网企业各类数据进行高效、可靠、低廉地存储,并快速访问和分析,是当前重要的研究课题。首先分析了大数据的特征和大数据的关键技术,其后,设计了大数据时代下的电力客户服务数据分析系统,提出了系统的数据体系架构,设计了系统功能,总结了系统的关键技术和算法,该系统利用大数据技术和数据仓库技术集中存储、管理和应用电网数据,通过元数据管理实现统一的数据服务平台,使用Hadoop数据库作为非结构数据的存贮平台和数据分析与挖掘的支撑平台,基于CDC数据仓库ETL模型设计数据仓库 ETL 构件,在数据展示层使用多维数据分析技术。最后,综述了系统应用案例,实践表明,系统具有成本低、扩展性较好、可靠性高、并行分析等特点,可以大大提高电网企业的客户服务水平。  相似文献   

15.
随着电网覆盖范围不断扩大,并网数据已呈指数型增长,使得数据处理与分析缓慢且成本高。针对海量化、多类型电网大数据,探究了电网大数据与云计算二者之间的关系,基于Hadoop系统建立了电网大数据云计算可执行框架,并根据云计算框架设计了智慧电网多能源电力调度系统结构框架和功能与界面,实现云计算框架在智慧电网上的应用。  相似文献   

16.
近年来,大数据产业保持高速发展态势,而过程工业大数据建模技术发展相对缓慢。在该背景下,以火电机组过程大数据为研究对象,首先分析火电机组过程大数据的特点及其进行大数据建模所面临的困难;接下来对现有国内外火电机组过程大数据建模方法及存在问题进行了分析;最后提出一种基于火电机组过程大数据的全工况自适应传递函数建模方法,该方法应用数据挖掘技术选取不同工况下的合格建模数据,通过云计算平台应用数据驱动传递函数建模方法建立全工况范围内大量的系统模型,再应用线性变参数及数学插值等算法对大量系统模型进行融合,最终获取系统全工况自适应传递函数模型。该建模思路为火电机组等过程工业大数据建模提供了一种较好的方法参考。  相似文献   

17.
典型大数据仓库-飞行试验数据仓库设计   总被引:2,自引:1,他引:1  
在现代数据仓库技术思想的指导下,围绕试飞数据的非结构化大数据的特点,面向型号工程对试飞数据的统一管理和高效处理需求,分别针对试飞大数据的粒度描述和综合管理,设计了飞行试验元数据标准和特有的基于二进制文件的数据库管理服务,解决了飞行试验数据仓库设计中结构化与非结构化大数据的统一维度建模和数据关系维护的关键技术问题,为基于数据仓库的试飞大数据在线管理与分析系统的建立提供了基础,满足了型号工程对试飞数据的高效分析需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号