首页 | 本学科首页   官方微博 | 高级检索  
     

大数据全生命周期中关键问题研究及应用
引用本文:刘道新,胡航海,张健,徐秀敏.大数据全生命周期中关键问题研究及应用[J].中国电机工程学报,2015(1):23-28.
作者姓名:刘道新  胡航海  张健  徐秀敏
作者单位:1. 华北电力大学经济与管理学院,北京市昌平区,102206
2. 国家电网公司,北京市西城区,100031
3. 北京中电普华信息技术有限公司,北京市海淀区,100192
摘    要:随着大数据时代的到来,大数据全生命周期中获取、存储、处理、挖掘等方面的研究逐步展开,成为行业、政府的研究热点。该文以国内外电力行业、金融、经济等数据为研究对象,对大数据的存储、处理、挖掘三大关键问题进行研究。根据大数据特点进行分类;建立基于改进稀疏矩阵、指标维度和指标数据分离方式的大数据压缩存储模型,实现大数据的压缩存储和动态扩展。提出按照指标分类及关联关系建立数据缓存模型的方法,实现大数据的高效访问和灵活转换。在挖掘展现时应用动态可配置的设计方法,解决数据查询海量页面的动态生成问题。该文可为大数据存储、处理、挖掘研究提供有价值的参考,并将研究成果应用到统一资源库的建设中。

关 键 词:大数据  压缩存储  缓存机制  动态配置  统一数据资源库

Research on Key Issues of Big Data Lifecycle and Its Applications
LIU Daoxin , HU Hanghai , ZHANG Jian , XU Xiumin.Research on Key Issues of Big Data Lifecycle and Its Applications[J].Proceedings of the CSEE,2015(1):23-28.
Authors:LIU Daoxin  HU Hanghai  ZHANG Jian  XU Xiumin
Affiliation:1. North China Electric Power University
2. State Grid Corporation of China
3. China Power Information Technology of Beijing
Abstract:
Keywords:big data  compressed storage  caching mechanism  dynamical configuration  unified resources database
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号