首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
首先给出了一种面向对象的实视图模型———对象视图模型,可以在数据仓库中描述复杂对象,并有利于前端工具OLAP的实现。然后在此基础上提出了对象视图模型增量维护算法———OMVIMA,该算法能够有效地实现从数据源到数据仓库中对象(数据)的增量抽取和加载等维护工作。最后给出了算法的性能和效率分析,并通过应用实例证明了该算法比基于纯关系实视图的实现方法具有更高的效率。  相似文献   

2.
基于多维护策略的物化视图选择方法   总被引:1,自引:0,他引:1  
物化视图是数据仓库环境中提高OLAP查询效率的重要手段,因此,物化视图的选择是数据仓库设计中重要的决策之一。本文提出的物化视图选择方法目标是选择合适的视图进行物化,使得查询处理的总代价和物化视图的维护代价最低,提出了物化视图收益模型,并在此基础上基于视图的多维护策略提出了物化视图选择的方法:基于增量和重计算的物化视图选择算法IRMVS、基于增量策略的物化视图选择算法IMVS和基于重计算策略的物化视图选择算法RMVs和基于增量策略的物化后代视图选择算法IMDVS,理论分析和实验表明这些算法是有效可行的。  相似文献   

3.
为了加快对大量数据的查询处理速度,通常在数据仓库以实视图方式存储数据,当基础数据发生变化时,这些实视图也必须随着更新,因而视图自维护和一致性维护成为数据仓库的重要问题。本文提出利用视图计算的中间结果创建辅助视图,在数据仓库中进行实体化,采用有效的增量维护算法计算实视图的精确变化,实现数据仓库视图自维护。  相似文献   

4.
张杰  叶德谦 《微处理机》2007,28(2):61-63
数据仓库(DW)是随着时间不断变化的数据集合。因此数据增量更新技术是数据仓库技术能否成功实施的关键。在目前的数据增量更新算法基础上,给出一种采用中间件来进行数据增量更新的方案和算法。并通过实例将此方法与原增量更新算法进行了细致的比较,说明了此算法有较好的更新效率。  相似文献   

5.
数据仓库的维护是数据仓库应用中的一个十分重要的问题,近几年产生了很多的维护算法。已有的维护算法多是针对单个实化视图的维护;或只针对简单SPJ视图的维护;或只针对聚集函数的维护;而实际的数据仓库大多是由包含聚集函数的多个实化视图组成。因此综合考虑包含聚集函数的多个实化视图的维护问题是必然的。文章正是在此情况下提出了一种基于多实化视图增量维护的基库生成算法,在《基于基库的多实化视图增量维护算法》中提出了包含聚集函数的多实化视图的维护算法。  相似文献   

6.
基于数据挖掘的煤矿安全信息管理模型的研究   总被引:1,自引:0,他引:1  
基于对数据挖掘技术、粗糙集理论、模糊逻辑与神经网络算法的分析,文章提出了一种基于数据挖掘的煤矿安全信息管理模型的设计方案。该模型应用Web服务器注册技术和XML数据合成技术形成终端数据库,采用数据挖掘技术中的粗糙集理论和模糊逻辑与神经网络算法形成终端数据仓库,并对终端数据仓库进行统一分析、管理和维护,有效地提高了煤矿安全信息管理的效率。  相似文献   

7.
实化视图的一致性维护是数据仓库联机维护的关键问题.本文分析了基于三层数据仓库体系结构的3VWQ算法中潜在不一致性的原因,给出了三层结构的改进方法并引入时间戳作为中间版本实化视图的一致性维护标记;提出一种基于时间戳的补偿算法,实现了增量查询维护过程中不一致更新的本地补偿,从而在保证较好性能的同时解决了维护查询过程中的一致性问题.  相似文献   

8.
动态生产调度管理系统的研究与实现   总被引:3,自引:0,他引:3  
《信息与控制》2002,31(6):504-507
本文基于知识发现提出了一类动态调度算法的框架,在此基础上,基于数据仓库建立 了动态调度管理系统的体系结构,并采用面向对象(Object-Oriented,O-O)技术,分析 和设计了动态调度管理系统,最后阐明了所提方法的优点.  相似文献   

9.
实体化视图是数据仓库中提高查询效率的有效手段,数据仓库运行期间,需要对其中的实体化视图进行维护,从而保证用户查询的响应时间较短。针对用于实体化视图动态选择的遗传算法收敛速度慢,运行时间长的问题,提出一种预处理算法来计算动态选择实体化视图时遗传算法的初始群体。理论分析和宴验结果表明,该算法可以有效地提高实体化视图动态选择时的寻优收敛速度。  相似文献   

10.
数据仓库中的视图选择在很大程度上影响数据仓库的查询效率和维护代价,是数据仓库中研究的重要内容.通过对现有的选择实化视图的价值模型进行研究,提出了一个新的视图价值估算模型和视图选择算法--PBPUS算法.该视图选择方法通过在视图选择前进行预处理和使用新的价值估算模型,降低了视图搜索的时间复杂度和维护代价,有效地提高了实化视图的查询效率.  相似文献   

11.
实化视图维护是指在数据源的原始数据发生改变时,有效地将这种变化反映到数据仓库中,使相应的实化视图得到及时更新.当前的视图维护方法主要以C/S结构为基础,当更新频繁时将会导致数据仓库超载而崩溃.针对这种现状,提出基于维护查询任务进行分解的实化视图并行增量维护P3Sweep算法,算法修正了Sweep算法只能顺序处理的限制,赋予其并行处理能力.对于单个更新,P3Sweep算法通过对维护查询任务进行分解,并行执行左右扫描过程来完成维护演算;对于并发更新,算法通过递归分解方式进行细粒度并行演算.性能计算和实验测试结果表明,该方法增加了系统对更新的吞吐能力,减少了维护的延迟,从维护查询任务本身实施对实化视图维护的优化.  相似文献   

12.
实体化视图作为数据仓库中存储的主要信息实体是由对上一级或外部数据源进行抽取、转化、传输和上载的数据构成的.当源数据发生变化时,如何进行数据仓库实体化视图的一致性维护以及0LAP查询,是一个有着实际意义的研究课题.本文提出一个改进性算法Glide*,该算法采用补偿思想来协调源数据库及实体化视图的一致性,从而对系统内存开销及维护工作量方面都有很大的改进.文章还通过一个示例说明了该算法在实际中的具体运用.  相似文献   

13.
在传统的实化视图维护时,数据源把增量数据以XML文档的方式报送给数据仓库,数据仓库从此文档中解析出数据,利用JDBC完成对实化视图的更新。文中提出在数据源把增量数据封装成序列化对象存储于文件中再报送给数据仓库,而数据仓库从文件中读出对象,利用Hibernate直接把对象更新到实化视图。通过两种方案性能的比较,表明后一种方案是可行并且更加高效的。  相似文献   

14.
DEMON: mining and monitoring evolving data   总被引:4,自引:0,他引:4  
Data mining algorithms have been the focus of much research. In practice, the input data to a data mining process resides in a large data warehouse whose data is kept up-to-date through periodic or occasional addition and deletion of blocks of data. Most data mining algorithms have either assumed that the input data is static, or have been designed for arbitrary insertions and deletions of data records. We consider a dynamic environment that evolves through systematic addition or deletion of blocks of data. We introduce a new dimension, called the data span dimension, which allows user-defined selections of a temporal subset of the database. Taking this new degree of freedom into account, we describe efficient model maintenance algorithms for frequent item sets and clusters. We then describe a generic algorithm that takes any traditional incremental model maintenance algorithm and transforms it into an algorithm that allows restrictions on the data span dimension. We also develop an algorithm for automatically discovering a specific class of interesting block selection sequences. In a detailed experimental study, we examine the validity and performance of our ideas on synthetic and real datasets  相似文献   

15.
数据仓库联机维护技术的研究与实现   总被引:3,自引:0,他引:3  
针对数据仓库联机维护技术提出了一种三层维护体系结构TMA,在其中引进了“数据仓库基库”概念,利用版本控制思想提出了对单视图和多视图的联机维护算法,并实现了一个原型验证系统。  相似文献   

16.
近似重复记录的增量式识别算法   总被引:2,自引:0,他引:2  
摘要数据清理是数据仓库中的一个重要研究内容,近似重复记录的识别是其中的一个技术难点。文章介绍了近邻排序方法,并以此为基础,研究了在数据模式与匹配规则不变的前提下,数据源动态增加时近似重复记录识别问题,提出了一种增量式算法IMPN(IncrementalMulti-Passsorted-Neighborhood)。文章最后给出了实验结果。  相似文献   

17.
语义异构生物数据源中的数据集成与更新   总被引:1,自引:0,他引:1       下载免费PDF全文
针对生物数据源的分布性、异构性和动态性等特性,探讨生物信息技术服务支撑系统整体解决方案,构建基于基因本体的信息集成模式以实现生物语义学上的数据集成。设计一种以半结构化形式规范生物元数据及基于MD5算法的增量更新技术,用以解决通用扩展性和效率问题,实现生物数据仓库中数据的共享并提高管理效率。  相似文献   

18.
数据仓库中基于密度的批量增量聚类算法   总被引:2,自引:0,他引:2  
数据仓库为数据挖掘提供了很好的平台,当数据仓库中的数据发生变化时,原来挖掘出来的模式也要相应地进行更新。MartinEster等最先提出了增量聚类算法,但算法在增量聚类过程中,更新对象依次一个个地单独处理,而没有考虑更新对象之间的关系,效率较低。该文提出了基于DBSCAN算法的批量增量聚类算法,减少了对象的检索,提高了增量聚类的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号