共查询到20条相似文献,搜索用时 46 毫秒
1.
《Planning》2014,(8)
Hadoop是一个分布式系统基础架构,已经广泛应用在云计算领域,Hadoop的框架最核心的设计是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。 相似文献
2.
《Planning》2019,(5)
大数据时代的诞生,为解决挖掘海量数据存储的信息带来了技术上的革命,通过网站点击存留的日志数据,分析这些数据,可获知许多对网站运营至关重要的信息。本文采用Hadoop分布式平台,使用HDFS数据存储,利用Hive来分析日志数据,设计一种Web日志分析系统,并阐述了系统的设计过程。 相似文献
3.
《Planning》2019,(5)
针对发布的Hadoop3.0,本文研究了Hadoop3.0大数据平台性能。首先,采用华为云服务器搭建大数据平台;其次,利用Hadoop框架提供的基准性能测试程序进行性能验证,测试指标包括TestDFSIO、MRBench和TeraSort。最后,对比分析不同负载、不同数据量对平台性能的影响。实验结果表明,Hadoop3.0在HDFS读写能力、MapReduce计算能力上均表现出较优的性能。 相似文献
4.
《Planning》2019,(17)
本文提出基于Scrapy和Hadoop的房屋价格爬取及存储系统,利用Scrapy框架通过多线程爬取,爬取结束后执行完整性检查,过滤出信息不完整的网页,进行再次爬取直到信息完整,以文本文件的形式存入HDFS(Hadoop Distributed File System),然后对爬取到的网页进行数据分析,提取出有价值的数据。 相似文献
5.
6.
《Planning》2017,(4)
为了实现海量文本数据的有效发掘和统计,从文本分类与大数据并行处理两个方面着手,研究在海量文本数据挖掘的相关理论知识和MapReduce编程模型的相关技术支撑下的海量文本数据挖掘统计方法。在并行运算模型的开源实现Hadoop平台上,提出了一种简单、有效的文本分类方法——基于MapReduce的平均朴素贝叶斯文本分类算法。 相似文献
7.
《Planning》2017,(6):724-729
目前并行计算和云计算平台已成为解决大数据挖掘的重要手段。并行计算是将大数据划分成独立的小数据分别进行计算,阐述了常用的分布式和MapReduce方法等数据挖掘方法。分布式方法将大数据以手动的方式划分为若干个子集,并采用相应的数据挖掘算法进行处理,通过合并子集结果来获得最终的结果。MapReduce方法基于云计算平台对数据进行筛选和排序,再拆分成若干个映射任务,最后汇总成最终的输出结果。结合国家电网四个大数据集对分布式和MapReduce方法在数据挖掘的准确性和效率上进行对比,仿真结果表明,除了类不平衡的数据集,MapReduce明显优于基准和分布式计算模式。 相似文献
8.
9.
随着BIM技术的发展,其在铁路行业的应用也逐渐普及。铁路BIM技术的实施和发展离不开BIM数据存储技术和BIM模型跨平台、跨专业交互等技术。随着铁路工程中BIM相关应用产生的数据体量越来越大以及用户对交互体验感受要求越来越高,如何高效可靠地存储BIM数据以及便捷快速的完成模型可视化交互成为BIM技术在实施过程中的一大挑战。基于此,文章研究面向铁路应用的BIM存储技术,重点讨论基于分布式大数据平台Hadoop的HBase数据库、图数据库Neo4j以及GIS数据库等技术在铁路BIM中的应用,此外,文章还对基于B/S与C/S架构的BIM模型跨平台交互技术以及其在铁路行业的相关应用进行了分析。 相似文献
10.
海量出租车轨迹数据预处理是轨迹数据挖掘和应用的前提。出租车轨迹数据是典型的大数据,传统的数据处理技术无法解决大规模出租车轨迹数据误差分析和处理问题,文章在分析轨迹数据误差来源和误差类型的基础上,提出基于Hadoop的海量出租车轨迹数据预处理模型,使用Hive实现轨迹数据误差统计分析,设计MapReduce并行处理程序实现轨迹数据预处理。实验结果表明,该模型可以有效解决大规模出租车轨迹数据预处理问题,处理方式可靠性较高,大大提高了轨迹数据预处理效率,为后期轨迹数据深入挖掘和分析奠定了基础。 相似文献
11.
《Planning》2018,(5):19-20
引领教师成为研究者,能有效地提高教师的教育教学能力。要让一个地区的大多数教师成为研究者,不能等待教师自动自发行动,而要制定有效的策略去组织、去引领。对教师进行教育科研的专业引领,要连续地、面对面地、手把手地引领,从选题确定到设计方案,再到调查研究,到最后的实践、反思、提炼以及撰写研究报告都需要跟进。只有通过这样的引领,教师才能成长为专业型教育教学研究者。 相似文献
12.
13.
14.
《工程质量》2005,(2)
浅议招标代理工作质量控制 招标 代 理 制 度 是 为 适 应 建 筑 市 场 工 程 招 标 而 建 立 起 来的,招标 代理 机 构 因 在 为 业 主 择 优 选 择 承 包 商 方 面 做 出 的 成绩而 为社会 所 接 受 , 但 由 于 工 程 招 标 代 理 尚 处 于 起 步 阶 段 ,实际 操作中 存在 许多不 尽如 人意的 地方 。招 标代理 的质 量控制必 须从招 标 代 理 的 几 个 主 要 环 节 入 手 ,目 前 招 标 代 理 程 序大致 划分为 :与 业主沟 通发 布招标 公 告 、资 格 审 查 、编 制 招 标文件 、开 标主持 与评标 报告 、资料 整 理 上 报 、工 程 回 访… 相似文献
15.
16.
17.
Rolf A. Deininger 《Water research》1982,16(1):31-36
Water quality data banks are needed to document the status and trends of water pollution in a country. Examples of such systems are the STORET system in the U.S., the NAQUADAT system in Canada and the EIS system in Scandinavia. All of these systems require trained personnel to help in the formulation of the inquiry and the actual querying of the system.By contrast, what is described in this paper is an on-line, interactive data management and analysis system which allows the user the direct search, update, retrieval and analysis of the data from a computer terminal. The user addresses the system in a high level language closely resembling English and has complete control over building, updating and querying the individual data banks. Almost all statistical operations can be performed on the data starting from histograms, distributions, correlations to regression, discriminant, component and spectral analysis. Commands for producing camera-ready graphs on graphic terminals are available.The system is implemented on The University of Michigan Computer System and can be accessed through local telephone numbers in more than 100 cities in the U.S. and Canada and from the major European capitals via the TELENET system. The operation of the system is illustrated on a small sample data base on the Ohio river provided by the Ohio River Sanitation Commission (ORSANCO). 相似文献
18.
《Planning》2017,(5)
在ORACLE数据库系统的理论学习和实际应用中,为保护数据表安全,分析用户数据管理具体需求,依据数据库字典管理平台,利用虚拟工具建立用户虚拟数据表,实现数据检索结果的别名输出。 相似文献
19.
20.