共查询到20条相似文献,搜索用时 437 毫秒
1.
刘姝 《郑州轻工业学院学报(自然科学版)》2014,(5)
针对海量数据的存储和处理,设计了一个基于Hadoop的云存储系统.该系统在分布式文件系统和MapReduce编程模型2个核心技术的基础上建立基于Hadoop的云存储模型,优化了存储方式,提高了集群中网络带宽和磁盘的利用率,同时MapReduce编程框架的设计使系统拥有更强的计算能力.该系统可通过Linux集群技术搭建Hadoop平台,进行测试和分析.应用实践表明,该系统具有低成本、高效率、易扩展和安全可靠等特点,能稳定高效地满足海量数据的处理要求. 相似文献
2.
4.
5.
6.
本文阐述了云计算和云存储的相关理论,对Hadoop分布式文件系统HDFS和计算模型MapReduce进行深入分析,通过Hadoop平台实现数据云存储,提供了稳定的共享存储和分析系统,从而解决访问速度和安全性问题,实现海量数据的存储管理。 相似文献
7.
工业大数据具有规模庞大、业务复杂等的特点,为数据存储、查询和分析计算带了难度。为了优化工业大数据存储管理,提高系统存储、查询、分析效率,利用基于Hadoop技术针对业务库和实时监控数据库的存储管理进行优化。系统设计业务库的集群化同步存储架构,基于Maxwell组件将MySQL业务库数据实时同步到HBase,实现业务库的读写分离、提高数据查询和数据分析的效率;其次,基于Kafka和Flink对业务库同步数据进行实时计算处理,实现高并发数据写入场景下的低延迟响应;最后,实验进行了HBase和MySQL的性能对比测试,结果表明本系统在大规模数据场景下具有更好的计算效率表现,能够有效进行工业大数据分析存储。 相似文献
8.
《烟草科技》2016,(4)
为解决传统数据仓库系统在数据存储、数据处理、数据展现能力等方面存在的问题,结合江苏中烟的实际应用情况,设计了烟草海量数据分析系统。借鉴DW2.0理论并结合大数据应用技术,引入分布式处理架构,采用传统数据仓库与Hadoop融合的方式,形成集成、协同的数据仓库架构;引入数据生命周期管理方法,提高系统的快速响应能力;利用Hadoop HBase处理非结构化数据,以Hadoop Map Reduce的并行计算框架作为通信层,调度和协调集群中各节点的计算和通信。测试结果表明,数据量在1亿条、10亿条时,新系统的响应时间比传统方式分别提升30%、80%,有效提高了数据查询效率,提升了企业数据仓库系统的应用水平。 相似文献
9.
10.
分析处理海量数据成为各电信运营商急需解决的问题。本文描述的基于Hadoop和Hive的数据仓库能很好的解决这个问题,Hadoop依靠普通的PC集群提供可靠的并行计算服务和存储平台,Hive基于M/R框架,提供类SQL功能的HQL语言,为用户提供了一个高效、海量和便捷的数据仓库平台。通过对电信行业海量话单的分析证明,此数据仓库解决方案在处理海量数据上,具有关系型数据仓库不能比拟的性能。 相似文献
11.
12.
近年来企业产生的数据量急剧增长,传统信息化技术和分析模式已经无法应对新的挑战。以Hadoop为代表的大数据分布式处理技术的出现,为企业处理日益增长的海量非结构化数据提供了高效、可扩展的低成本解决方案。大数据技术可以有效弥补传统数据仓库的不足,深化和拓展企业的商业智能,提高决策水平,形成数据驱动的决策机制,推动企业信息化管理进入全新的阶段。 相似文献
13.
随着信息技术的发展及云时代的来临,大数据不仅将成为信息社会的重要财富,同时也将带来巨大的挑战。在许多领域数据都是源源不断的产生,形成了"数据灾难",要发挥数据的作用,数据处理与分析起到了关键作用。Hadoop被公认为大数据行业标准开源软件,在分布式环境下提供了海量数据的处理能力,其最核心的设计是为海量数据提供存储的HDFS(Hadoop分布式文件系统)和对海量数据进行计算的Map Reduce。本文将对大数据Hadoop框架进行介绍以及简要描述基于Hadoop架构的数据处理流程与实践。 相似文献
14.
本文在对分布式存储技术探究的基础上,结合医学影像存储的实际情况,分析了Hadoop技术在构建区域医学影像存储平台时存在的问题,通过改变文件格式和存储架构,实现对海量医学影像数据存储的同时又满足临床应用的实时性要求。 相似文献
15.
16.
17.
18.
针对国内电子行业转型升级智造与创新的需求发展,以传统卡片为核心的工艺设计模式已无法适应工艺协同设计新的发展需求,更无法满足后端ERP(企业资源计划)与MES(制造执行系统)需要的数据要求。文章将结合结构化工艺详细描述结构化工艺设计的理念、流程、技术难点及工艺数据应用,以期为将建设结构化工艺的企业提供参考和帮助。 相似文献
19.