首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
党怀义 《测控技术》2014,33(3):49-52
针对飞行试验数据的海量非结构化的特点以及当前所面临的处理与应用问题,研究分析当前新兴的云技术,提出了飞行试验数据云计算应用架构的3个组成要素:设备系统、云存储和云计算。面向试飞数据工程应用,以试飞科目、试验动作段为频度矩阵建立试飞元数据存储阵列,实现海量非结构化试飞数据的云存储应用;以SOA架构为基础,结合面向应用的处理功能组件,实现分布式网络计算调度和计算群集,为用户提供高效的云计算服务。工程实践应用表明,该系统以灵活架构有效地解决了非结构化大数据信息的高效存储、统一管理和共享应用,实现了海量试飞数据的快速分析处理,展示了云计算技术的先进特点。  相似文献   

2.
制导仿真试验和飞行试验都会产生许多数据,数据逐渐累积形成海量数据,针对分析需求对数据进行有效管理,制导仿真数据的管理成为当前国内仿真界面临的难题.鉴于数据仓库管理海量数据、面向分析、支持决策的特性,将数据仓库技术引人到制导仿真数据管理领域,设计出了制导仿真数据仓库的体系架构.针对制导仿真所涉及数据的特点,对制导仿真数据仓库构建过程中先对数据预处理进行研究,提出了制导仿真数据仓库的数据预处理模型,进行仿真证明,模型能有效指导制导仿真数据仓库构的数据预处理工作,可为有关人员快速有效地获取所需数据.  相似文献   

3.
试飞数据是民机飞行试验的重要产物,具有测量参数数量大,数据体量大,飞行试验数据与试飞任务信息关联性强等特征,支撑飞机型号取证与设计优化等任务。试飞数据平台数据架构对多源异构数据集成接入、多类形态数据存储管理、多种层次数据处理分析等技术进行了研究,采用湖仓一体的关键技术和方法打造试飞数据全集。试飞数据接入采用流批一体的数据处理技术,融合Spark和Flink主流数据处理引擎,具备试飞数据快速入库能力。提出按秒聚合方法,具备PB级多维度试飞数据压缩存储功能,存储性能提升近10倍;采用以秒为索引条件支持快速检索,强化数据湖查询能力。研究数据仓库技术,设计试飞数据多层数据模型,具备多维信息精细查询,多层数据灵活钻取,多功能自定义函数集成等功能,并成功应用在某型国产民机的飞行试验数据管理中,服务于试飞数据用户,提高了试飞数据管理效率与试飞数据应用价值。  相似文献   

4.
飞行试验是航空装备研制的重要环节之一,形成和产生的工程数据具有明显的大数据特征。传统的以试验测试数据为主的数据管理思想,难以保证试飞工程数据及其关系的完整性和准确性,无法全面表征飞行试验全过程,不利于试飞数据的再利用。在分析航空飞行试验复杂系统工程的有机组成及其工程大数据的本质特征和逻辑结构的基础上,结合近年来在飞行试验数据管理和处理研究中取得的技术成果和实践经验,提出了基于试飞工程全生命周期的航空飞行试验工程大数据管理思想,以试验对象为中心的一体化大数据采集和系统化大数据结构模型,和面向业务的基于SOA的分布式系统框架,便于建立一个综合、全面、开放的试飞工程大数据管理和挖掘应用平台,促进航空产品试飞数据处理效率的提升和试飞工程大数据在航空科研中的挖掘和广泛应用,发挥试飞工程大数据的发展助推作用。  相似文献   

5.
飞行试验工程大数据是典型的工业大数据,是试飞工程规划、设计、执行、评估以及开展航空科学研究的最重要的基础。文章分析了试飞工程大数据的质量特性及其影响因素,学习借鉴国际标准化《数据治理白皮书》提出的数据治理思想体系与模型,针对试飞工程大数据管理与应用特点,结合多年来在试飞工程中的大数据管理应用的实践经验,提出了以飞行试验大数据标准化体系为基础,以涵盖试飞工程全过程和全业务流程的试飞数据质量监控系统和一体化的试飞大数据管理与应用系统为并行相互支持的大数据治理技术平台,将试飞业务流程、业务策略、业务标准、业务逻辑以及组织管理有机有效地融入到数据管理与治理体系中,形成能够不断自我完善、自我更新、自我规范、开放共享的试飞工程大数据治理体系,对飞行试验工程以及航空科学研究步入“大数据科研范式”奠定数据基础。  相似文献   

6.
基于数据仓库的QAR数据分析   总被引:1,自引:0,他引:1  
针对现有各航空公司分析QAR数据的平台不统一、QAR数据量大、分析和处理数据能力不足、导致海量的数据变成了信息垃圾,在对QAR数据和数据仓库技术研究基础上,结合航空公司关心的问题,设计了QAR数据仓库,给出了数据仓库模型的设计,详细阐述了QAR数据分析主题的提取方法,提出QAR数据仓库的星型模型.通过ETL设计了多维数据集,以超限事件为例展现了对QAR数据的安全分析,为航空公司改进飞行品质、提高安全系数提供依据.  相似文献   

7.
飞行试验数据是航空武器装备研制过程中所形成的最重要的科研信息资料,是型号定型、鉴定的根本依据,具有宝贵的科研价值;试验数据管理的目的不仅是保证数据的完整性和可靠性,更重要的是能够广泛地、灵活地满足各类用户对数据的处理需要;针对飞行试验数据及其应用的特点,设计出了一种基于先进SOA技术架构的飞行试验数据管理系统(FTDMS),以飞行试验数据总线为纽带,采用分布式网络计算服务模式,有效适应了飞行试验数据处理方法的不断发展,而且同时满足了多用户对多型号、多类型非结构化试飞数据的完整管理和应用,综合提高了试验数据的管理和应用效率。  相似文献   

8.
商业银行的数据规模随着传统业务扩展和互联网发展水平的不断提高而与日俱增,使得银行对数据的存储、管理和应用要求越来越高。通过搭建基于Hadoop技术的大数据平台,利用分布式文件系统HDFS、SQL分析引擎Inceptor、Nosql数据库工具Hyperbase、流处理工具Stream等架构,探索了大型商业银行Hadoop分布式数据仓库的构建过程,最终实现了由基于集中式存储架构的传统关系型数据仓库向分布式数据仓库的迁移工作。该分布式数据仓库实现了结构化数据和非结构化数据的存储、ETL调度管理、历史数据检索、交互式分析以及流数据处理。应用表明,相比基于集中式存储架构的传统关系型数据仓库,分布式数据仓库可大幅提高数据存储和数据服务的效率。  相似文献   

9.
基于数据仓库技术的工程数据管理系统的研究与实现   总被引:9,自引:0,他引:9  
工程试验产生的数据组织分散、模式复杂而多变,从而要求工程数据管理系统能够统一管理数据,并具有良好的用户定义特征和数据扩展能力.本文描述了一个面向工程试验数据仓库体系结构的分析和设计,并实际应用到了试飞数据管理系统中,达到了预定的目标.同时提出了利用元对象实现不同模式数据集中管理和使用的方法.  相似文献   

10.
现代航空武器装备综合化和信息化程度越来越高,飞行试验测试数据的种类增多,测试数据量剧增,飞行试验进入了大数据时代;试飞大数据的来临,对试验数据的获取、记录、传输和处理等传统技术及模式产生了强大的冲击,也提出了严峻的挑战;文章在简要介绍大数据概念及国外研究应用现状的基础上,通过总结分析飞行试验数据的新特征、新需求,提出了“试飞大数据”的概念,得出飞行试验数据是典型大数据的结论;按照试飞测试流程和大数据技术范畴,重点分析了试飞大数据技术中的数据获取、交换、记录、传输、监控、处理、存储等关键技术,最后,对试飞大数据技术的应用前景进行了展望.  相似文献   

11.
数据仓库是连接底层数据源与上层应用的枢纽。该文介绍了数据仓库的填充(与数据源的连接)和数据仓库的访问(与应用界面的连接)技术,包括与数据库数据源和非数据库数据源的连接以及采用组件工具访问数据仓库的方式和实现方法。  相似文献   

12.
数据网格的数据管理策略   总被引:6,自引:0,他引:6  
数据网格的目标是使数据密集型的高性能计算和数据密集型的数据共享事务处理及科学研究成为可能,数据网格主要包括数据存储系统和数据管理系统两大部分.数据管理系统对所存储的数据进行管理,主要包括数据的传送和复制等操作.文章对数据管理策略进行了详细的分类评述并且讨论了目前数据管理系统中的某些局限性和进一步的工作.  相似文献   

13.
数据仓库系统中源数据的提取与集成   总被引:12,自引:0,他引:12  
人们对数据分析的要求的不断提高导致了数据仓库的发展,而在建设数据仓库的过程中非常关键的一步就是从事务数据库或其它的数据源中抽取和集成原始数据。本文在对数据集成方法和数据获取中可能碰到的问题进行全面分析的基础上,较为详细地介绍了我们自行开发的数据仓库系统SEUwarehouse中源数据提取与集成工具的设计与实现.  相似文献   

14.
涂菲菲  周明辉 《软件学报》2019,30(5):1522-1531
问题追踪系统和版本控制系统等软件开发支持工具已被广泛应用于开源和商业软件的开发中,产生了大量的数据,即软件开发活动数据.软件开发活动数据被广泛应用于科学研究和开发实践,为智能化开发提供支持.然而数据质量对相关的研究和实践有重大影响,却还没有得到足够的重视.为了能够更好地警示数据使用者潜在的数据质量问题,通过文献调研和访谈,并基于自有经验对数据进行分析,总结出了9种数据质量问题,覆盖了数据产生、数据收集和数据使用这3个不同的阶段.进一步地,提出了相应的方法以帮助发现和解决数据问题.发现问题是指加强对数据上下文的理解和通过统计分析及数据可视化发现潜在的数据质量问题,解决问题是指利用冗余数据或者挖掘用户行为模式进行修正.  相似文献   

15.
基于数据仓库的数据转移方法   总被引:1,自引:0,他引:1  
数据转移是企业实施数据仓库的关键 ,针对数据仓库的技术特点 ,结合微软公司的数据仓库解决方案和数据转移服务 DTS,对数据转移过程中的几个典型问题 ,给出了其各自的解决方案  相似文献   

16.
重建数据立方体的数据覆盖方法   总被引:1,自引:0,他引:1  
曹蓟光  王申康 《软件学报》2002,13(8):1586-1592
数据切片体现了数据立方体某方面的数据特征,当产生数据切片的数据立方体由于某种原因不可访问时,通过已知的多个数据切片尽可能地恢复数据立方体中的原始信息,有利于对数据的深入分析和理解.提出了一种基于数据切片重建数据立方体的方法,通过数据切片的连接生成多维细粒度空间,利用数据覆盖操作逐步细分每个数据切片所对应的多维空间,以逼近多维细粒度空间.提出了重建后数据立方体的可查询判据.该方法直接利用数据库中的基本操作来实现,高效地支持大数据量的应用环境.  相似文献   

17.
大数据的一个重要方面:数据可用性   总被引:9,自引:0,他引:9  
随着信息技术的发展,特别是物理信息系统、互联网、云计算和社交网络等技术的突飞猛进,大数据普遍存在,正在成为信息社会的重要财富,同时也带来了巨大的挑战.数据可用性问题就是大数据的重要挑战之一.随着数据的爆炸性增长,劣质数据也随之而来,数据可用性受到严重影响,对信息社会形成严重威胁,引起了学术界和工业界的共同关注.近年来,学术界和工业界开始研究数据可用性问题,取得了一些的研究成果,但是针对大数据可用性问题的研究工作还很少.介绍了大数据可用性的基本概念,讨论大数据可用性的挑战,探讨大数据可用性方面的研究问题,并综述数据可用性方面的研究成果.  相似文献   

18.
数据中心基础数据积累通常使用三种手段:1)ETL技术;2)数据联邦技术;3)中间件技术.但三种技术侧重各有不同,不能同时满足数据集成的持久性与可用性.结合技术优势提出数据虚拟整合,为解决数据虚拟异构数据模型间的数据转换问题,通过对数据虚拟的分析,提出了一种基于元数据驱动的数据虚拟系统体系结构.构建了用于描述和存储映射策略的支撑元模型,并建立了相应数据路由策略.提出了对等主键思想,降低了处理阻抗.  相似文献   

19.
公司经过十多年的信息化建设,信息系统已全面覆盖企业经营、电网运行和客户服务等业务领域及各层级应用,为公司各项业务有效运转提供了有力支撑.但现今仍缺乏一套统一的企业级数据资产管理体系.为进一步提升数据在电网企业的价值,本文提出了一套基于数据中台的企业级数据资产管理体系,主要从数据质量提升优化、数据资产管理、数据共享服务构...  相似文献   

20.
数据治理技术   总被引:2,自引:0,他引:2       下载免费PDF全文
吴信东  董丙冰  堵新政  杨威 《软件学报》2019,30(9):2830-2856
随着信息技术的普及,人类产生的数据量正在以指数级的速度增长,如此海量的数据就要求利用新的方法来管理.数据治理是将一个机构(企业或政府部门)的数据作为战略资产来管理,需要从数据收集到处理应用的一套管理机制,以期提高数据质量,实现广泛的数据共享,最终实现数据价值最大化.目前,各行各业对大数据的研究比较火热,但对于大数据治理的研究还处于起步阶段,一个组织的正确决策离不开良好的数据治理.首先介绍数据治理和大数据治理的概念、发展以及应用的必要性;其次,对已有的数据治理技术——数据规范、数据清洗、数据交换和数据集成进行具体的分析,并介绍了数据治理成熟度和数据治理框架设计;在此基础上,提出了大数据HAO治理模型.该模型以支持人类智能(HI)、人工智能(AI)和组织智能(OI)的三者协同为目标,再以公安的数据治理为例介绍HAO治理的应用;最后是对数据治理的总结和展望.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号