共查询到18条相似文献,搜索用时 62 毫秒
1.
本文从更灵活的角度出发,提出了一种崭新的构建数据立方体的方法。首先定义了各数据体的代数表示模型,然后在此基础上阐述了如何建立数据立方体的操作,而且定义了在数据立方体形成之后添加或删除一个维或度量的操作,以及维与度量在一个数据立方体中转换的操作。 相似文献
2.
水利普查数据更新维护是全国水利普查成果长期有效应用的重要支撑和保障。第一次全国水利普查后,数据更新是否及时,质量能否保障,共享能否畅通,以及现有数据能否满足需求等问题将是影响普查成果在水利信息系统应用的重要制约因素。针对这些问题,着眼于构建\"统一化、专业化、标准化\"的水利数据中心,形成一体化的国家基础水信息平台为总体目标,提出数据更新维护应遵循的多样性、适用性、规范性、协同性、同步性等5项原则,重点研究数据更新维护实施的技术手段及路径,并初步探讨相关标准、管理制度及工作流程,以建立数据更新维护过程的长效机制,确保水利数据资源得到充分利用。 相似文献
3.
4.
文章在介绍Oracle数据库服务及相关体系软件结构的基础上,给出了利用Oracle数据仓库建立水利普查数据展现系统的实现技术,解决了因为原始数据库数据量庞大,数据关系复杂,导致数据查询速度慢等性能问题,并从多方面清晰、简洁、直观地展现水利普查数据. 相似文献
5.
数据预处理是KDD的关键一步,良好的数据预处理可以极大地提高数据挖掘的效率。该文提出了一种基于数据立方体的数据泛化算法用于数据预处理,能够为数据挖掘提供良好的数据环境,提高数据挖掘的有效性。 相似文献
6.
数据仓库中的维数据或度量数据都是确定的,其多维分析也是基于确定数据展开的。在现实中,由于环境的复杂与不确定性,常常需要对模糊数据进行多维分析。文章利用隶属度函数实现确定数据的模糊化,形成基于模糊数据的数据立方体,用以展开多维分析。 相似文献
7.
8.
9.
10.
Cube算子的计算在OLAP应用中起着极为重要的作用。本文分析了在高维Cube算子计算中传统流水线方法的不足之处,提出了通过有选择地实例化Cube中的部分节点以提高OLAP性能的解决方案,并给出了一个获取需要实例化节点的算法。 相似文献
11.
通过扩展 BUC算法 ,提出了 HBUC算法 ,自底向上地计算维上带层次的数据立方 .HBU C算法的关键在于对层次之间的映像关系进行了合理地编码 ,并选择了恰当的层次扫描路线 ,这些不仅能够保证 HBU C算法继承和扩展BUC算法的优化过程 :Write- Ancestors和 Collapsing,而且使粗粒度级的聚集计算因为共享细粒度级的排序结果而得到加速 ,从而大大提高了 HBUC的计算效率 . 相似文献
12.
Hongjun Lu Jeffrey Xu Yu Ling Feng Zhixian Li 《Distributed and Parallel Databases》2003,13(2):181-202
Parallel data processing is a promising approach for efficiently computing data cube in relational databases, because most aggregate functions used in OLAP (On-Line Analytical Processing) are distributive functions. This paper studies the issues of handling data skew in parallel data cube computation. We present a fully dynamic partitioning approach that can effectively distribute workload among processing nodes without priori knowledge of data distribution. As supplement, a simple and effective dynamic load balancing mechanism is also incorporated into our algorithm, which further improves the overall performance. Our experimental results indicated that the proposed techniques are effective even when high data skew exists. The results of scale-up and speedup tests are also satisfactory. 相似文献
13.
基于MS Analysis Services的数据挖掘的开发模式 总被引:1,自引:0,他引:1
利用Microsoft SQL Services2000提供的开发工具和数据挖掘模型,提出了一种完整的数据挖掘系统结构和实现方案,适用于中小型的数据挖掘应用。 相似文献
14.
数据仓库在决策支持系统(DSS)中起着核心作用,而要创建一个好的数据仓库,如何划分数据粒度是要解决的一个重要问题。通过数据粒度划分方法的分析,结合实例给出了一种划分多重粒度级别的层次编码解决方案,该方法具有安全高效、可基于概念层次对数据进行分析、编码易扩充、编码数据准确规范等优点。最后给出利用层次编码方案解决不同粒度级别数据查询统计的基本思路和方法,结合项目实践证明该方案确实可行,是解决多重粒度级别的好方法。 相似文献
15.
系统将人口普查与地理信息系统有机地结合起来 ,能够对太原市人口普查数据进行管理和人口统计制图 ,并可对人口普查数据进行多方面分析 ,实现了数据的可视化表示。 相似文献
16.
文章利用并行计算框架MapReduce,探索数据立方体的计算问题。数据立方体的计算存在两个关键问题,一个是计算时间的问题,另一个是立方体的体积问题。随着维度的增加,计算时间将呈现指数级的增长,立方体的体积也是如此。尽管MapReduce是一个优秀的并行计算框架,但在处理数据倾斜时,分区算法不够完善,导致一些计算任务时间过长,影响整个作业的完成时间。本文通过数据采样的方式,优化数据分区,实验结果表明,数据立方体的计算的性能明显提升。为解决数据立方体体积过大的问题,在Reduce阶段将最终的结果输出到基于NoSQL的HBase数据库进行存储,HBase方便水平扩展,同时也便于日后对数据立方体的查询。 相似文献
17.
OLAP(联机分析处理)是一种数据分析技术,它和数据仓库有着密切的联系,详细阐述了OLAP技术在电信领域的应用,以及OALP技术和数据仓库的一些关系。以移动电话业务收入总量为分析主题,确定了分析方法,定义了维度,并构造分析了立方体和星型结构,最后对结果进行了分析。 相似文献
18.
文章基于LINUX环境,利用NS2仿真工具,对链路数据流的混沌特性进行了实验验证,并对关联维数、Lya-punov指数等重要的混沌参数进行了定量分析。 相似文献