首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
联机分析处理数据立方体代数   总被引:11,自引:1,他引:10  
裴健  柴玮  赵畅  唐世渭  杨冬青 《软件学报》1999,10(6):561-569
数据立方体是多维数据库和以多维分析为基础的联机分析处理技术的核心机制.文章提出了一个支持多维数据库和多维分析的关于数据立方体的代数,从而为数据仓库及联机分析处理的语义描述提供了理论基础.同时,文章还论述了数据立方体的一些应用,以证明该工具所具有的强大功能.  相似文献   

2.
多维数据立方体模型及其基于关系的实现   总被引:6,自引:0,他引:6  
数据立方体模型是多维数据库和以多维分析为基础的联机分析处理技术的核心机制。本文参照当前对鑫维数据立方体模型的最新研究成果,提出了一种新的模型并且应用于OLAP服务器基于关系的实现。并且提出了实现的难点和改进的方向。  相似文献   

3.
数据立方体模型是多维数据库和以多维分析为基础的联机分析处理技术的核心机制,本文参照当前对多维数据立方体模型的最新研究成果,提出了一种新的模型并且应用于OLAP服务器基于关系的实现。并且提出了实现的难点和改进的方向。  相似文献   

4.
GIS按照数据结构可以分为矢量数据和栅格数据两种。GIS的空间建模大部分是基于栅格数据进行的,因此,对于一些在矢量结构中表达的属性(如人口密度等),需要转换成栅格数据。传统的数据转换方法一般都是面积占优法,这种方法没有充分考虑空间数据的模糊性问题。采用模糊粗糙集的理论,对矢量多边形数据转换成栅格数据的方法做了探讨。基于模糊粗糙集的数据转换方法考虑到了多边形数据的边界模糊性,利用隶属函数来确定多边形边界的不确定性。  相似文献   

5.
王惠惠  魏立力 《计算机应用》2007,27(6):1407-1410
传统的变点识别算法都是在精确数据集上实现的,从而忽略了数据对分析者的重要程度这一先验信息。提出用一种基于模糊点的回归类挖掘算法来识别变点。该方法首先逐步挖掘模糊点数据集中的回归类,然后确定回归变点,因而变点的数目是自动获得的,无须事先确定。试验表明,该方法不仅具有高度的稳健性,而且通过引入模糊点,将要分析数据的先验信息引入到回归类的挖掘过程中,因而所得的变点估计更具实用性。  相似文献   

6.
针对不确定性数据中模糊关联规则的挖掘问题,提出一种基于群搜索优化(GSO)算法优化隶属度函数(MF)的模糊关联规则挖掘方法。首先,将不确定性数据通过三元语言表示模型进行表示;然后,给定一个初始MF,并以最大化模糊项集支持度和语义可解释性作为适应度函数,通过GSO算法的优化学习获得最佳MF;最后,根据获得的最佳MF,利用改进型的FFP-growth算法来从不确定数据中挖掘模糊关联规则。实验结果表明,该方法能够根据数据集自适应优化MF,以此实现从不确定数据中有效地挖掘关联规则。  相似文献   

7.
提出了一种基于模糊神经网络的数据采掘新方法。该方法首先基于Rough sets思想获取初始规则和训练集,基于采掘属性的数目和分类目标确定网络结构,通过遗传(GA)算法对网络进行优化,通过BP算法实现网络权值的在线调整,最后对所生成的规则进行简化,提取模糊规则。仿真实例结果表明,该方法是行之有效的。  相似文献   

8.
本文基于多维数据环境设计了电力数据中心安全生产分析系统,统一了数据环境,基于抽取、转换、装载获取了高质业务数据,提供了以业务数据为载体的多维分析能力.通过熟悉了解电力企业安全生产业务,利用ODS、数据仓库(DW)、数据集市技术(DM)、ETL技术等,实现了安全生产分析系统.同时基于多维数据环境进行了系统测试,结果表明系统的ETL与BI实现都成功通过了电力企业真实业务数据严格测试,且运行稳定性与可靠性良好,与实际需要明确相符.  相似文献   

9.
针对房地产信息系统积累的大量房产数据,研究并实现基于数据仓库及OLAP技术的房地产智能数据分析系统.首先建立了分离的数据仓库,并对数据仓库进行多维建模和多维分析;然后对多维数据模型进行了切片、切块,旋转、上钻和下钻等多维分析,从多角度进行房产数据分析,并计算房产指数;最后利用前端开发工具开发了可视化的多维分析和数据展示平台.实践表明,基于数据仓库的房产数据分析系统可以为房地产管理层和决策层提供高效的决策支持.  相似文献   

10.
一种数据驱动的Ⅱ型T-S模糊建模方法   总被引:2,自引:0,他引:2  
现场采集的数据不可避免地包含一些诸如噪声干扰之类的不确定性,由数据驱动建立的模型需要具备较强的处理不确定因素影响的能力.在以往文献的Ⅰ型T—S模糊建模方法的基础上,提出了一种基于数据驱动的Ⅱ型T—S模糊建模方法.其过程是通过分析采集的数据样本计算得到不确定因素的影响程度,在Ⅰ型T—S模糊模型的基础上,前件参数上采用Ⅱ型的模糊集来代替Ⅰ型的模糊集,后件参数上则采用Ⅰ型模糊集来代替数值,由此拓展得到Ⅱ型T—S模糊模型.最后通过pH中和反应过程对所提出的方法进行仿真验证.仿真结果表明,该方法建立的模型能更好地处理不确定因素的影响,取得更高的准确度.  相似文献   

11.
基于XML技术的数据仓库多维数据模型   总被引:4,自引:0,他引:4  
本文介绍了一种基于关系数据库、利用 XML技术实现多维数据模型方法 .首先讨论了在关系数据库之上构建数据仓库的系统结构 ,利用面向对象的技术构建一个逻辑多维数据模型 ,通过 XML 文档保存多维数据模型的元数据 .配合数据仓库的数据抽取工具、汇总工具可以实现数据仓库的基本功能 .对于实现关系数据库之上 OL AP和数据挖掘有一定的参考价值 .  相似文献   

12.
王振华  周雪楠  黄冬梅 《计算机科学》2015,42(2):182-184,190
海洋数据具有海量、多源、多类和多维等特性,其数据质量具有不确定性现象,传统的抽样检验理论不能满足海洋数据质量检验的需求.在抽样检验模型的制定中引入了梯形模糊数的思想,将抽样检验模型的制定抽象为模糊线性规划问题,建立了模糊的质量抽样检验模型,解决了具有不确定质量参数海洋数据的质量检验问题,从而完善了抽样检验模型的系统体系.  相似文献   

13.
基于数据立方体的数据仓库安全控制   总被引:1,自引:0,他引:1       下载免费PDF全文
周海晴  陈启买  刘海 《计算机工程》2010,36(10):152-154
针对数据仓库与在线分析处理(OLAP)系统存在的数据仓库非法访问和敏感信息间接推理问题,在原有统计数据库安全体系架构的基础上,构建OLAP的3层安全控制体系架构,并结合该架构提出一种新的基于数据立方体的推理控制方法。该方法先预防m维推理,然后清除一维推理,简化了m维推理的检测过程。  相似文献   

14.
数据质量多种性质的关联关系研究   总被引:1,自引:0,他引:1  
信息化时代数据海量增长的同时,用户需要利用多种指标从不同性质方面对数据质量进行评价和改善.但在目前数据质量管理过程中,影响数据可用性的多种重要因素并非完全孤立,在评估机制和指导数据清洗规则时,彼此会发生关联.本文研究了在实际信息系统中适用的综合性数据质量评估方法,将文献所提出以及在实际的信息系统中常用的数据质量性质指标,按其定义与性质进行归纳总结,提出了基于性质的数据质量综合评估框架.随后针对影响数据可用性的四个重要性质:精确性、完整性、一致性、时效性整理出在数据集合上的操作方法,并逐一介绍其违反模式的定义,随后给出其具体关系证明,进而确定数据质量多维关联关系评估策略,并通过实验验证了该策略的有效性.  相似文献   

15.
农民工医疗健康问题是政府长期关注的难题之一, 农民工医疗健康信息分析系统旨在对农民工医疗健康信息数据进行统计与挖掘, 辅助政府决策. 基于数据仓库中的维度建模理论, 结合农民工医疗保健需求及卫生服务活动特点, 建立面向数据分析的农民工医疗健康信息的多维数据模型, 对数据分析及挖掘的应用及方法进行初步设计, 为农民工医疗健康信息数据分析提供基础, 并为政府相关部门提供参考.  相似文献   

16.
由于人力资源系统决策数据多维化,导致决策准确率较低,因而提出基于多维数据管控的人力资源系统决策方法.采用特征空间重构更新人力资源系统决策数据,定量递归分析融合决策过程中的多维数据,采用纳什均衡解的方法,将多维数据管控步骤转换为多维解向量优化问题,提取多维数据管控特征,利用联机分析处理工具,以报表的形式展现,得到优化的决...  相似文献   

17.
多维数据模型中维层次结构的自动生成算法及其实现   总被引:1,自引:0,他引:1  
多维数据模型是数据仓库及联机分析处理的核心,目前主要有两种:星型模型和雪花模型。维层次结构是多维数据模型最重要的概念之一。该文提出了一个算法,它能够在雪花模型中根据维表间的依赖关系构造维的层次结构。指出使用该算法的前提并进行了证明,随后实现了算法。文章最后提出了在星型模型中构造维的层次结构的基本过程。  相似文献   

18.
为了解决具有密度高、关联复杂的异构大数据网络的数据挖掘效率低下问题,基于多维关联架构,结合细粒度控制提出了数据挖掘算法.首先,在异构大数据网络存储与转发、处理的数据个性特征和差异化的基础上,给出了异构大数据网络数据定义和多维关联模型.接着,基于大数据网络多维关联初始化进程,通过大数据单位重构、维度置换、细粒度化和粒度均衡等,提出了多维关联细粒度数据挖掘算法.最后,通过与粗粒度算法、线性化结构数据挖掘算法对比了在不同网络规模和数据规模下的执行效率.实验结果表明,所提算法具有更佳的执行效率.  相似文献   

19.
基于数据分组匹配的相似重复记录检测   总被引:1,自引:0,他引:1       下载免费PDF全文
周丽娟  肖满生 《计算机工程》2010,36(12):104-106
针对数据集成中相似重复记录的识别问题,提出一种数据特征属性优选分组的算法。通过计算特征属性的方差来确定某维属性的权值,基于数据分组思想选择权值大的属性,将数据集分割成不相交的小数据集,并在各小数据集中用模糊匹配算法进行相似重复记录的识别。理论分析和实验结果表明,该方法识别效率和检测精度较高。  相似文献   

20.
现有电力企业发电指标统计渠道较分散,发售配电各个环节产生的数据种类繁杂且体量较大,因此针对电力数据质量差、已挖掘价值低的问题,本文采用大数据预测神经网络和数据平台可视化展示的方法,以某发电企业为研究对象,构建了发电量预测的模型及以此为核心的数据平台。发电量预测的应用服务支持PC和APP端,涵盖了某电力企业所有控股电厂及新能源项目,以滚动预测的模式迭代优化算法模型,提高发电量预测精度,有利于安排生产、燃料采购、物资计划,进一步做好污染物排放预测和管控。平台重点实现了数据多维管理和用户界面的可视化展示。数据层面,从源头做好数据采集清洗和数据库实时数据交互;用户层面,更直观形象展示大数据预测从获取数据、数据分析及预处理、数据训练到预测的四个阶段。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号