首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
实视图选择问题是数据仓库研究的重要问题之一。数据仓库存储实视图主要为OLAP查询,用户查询响应时间是首要考虑的问题,提出了查询代价视图选择问题,给出了其代价模型。提出了对查询代价视图选择问题利用遗传算法来解决的方法和策略。经实验证明,该算法达到了良好的效果,效率高。  相似文献   

2.
数据集成中XML数据查询语义重写   总被引:10,自引:0,他引:10  
查询重写是数据库研究的一个基本问题,它和查询优化,数据仓库,数据集成,语义缓存等数据库问题密切相关,为提高集成系统的查询效率,系统选择提交频率较高的XML查询物化为中间层视图,用户提交查询后,系统尽可能利用中间视图层中视图,而不是访问数据源来回答查询,这个问题实际可以归结为半结构化查询重写问题,考虑到中间视图层空间的有限性,已有视图应当尽可能回答更多的查询,传统查询重写方法有考虑半结构化数据之间的约束,而根据约束可以等价变换查询,从而提高中间视图层中的表达能力,提出了一种新的半结构化查询重写的方法,该方法在保证算法正确性和完备性的基础上,利用上半结构化数据中的约束,尤其是XML文件中的路径依赖,来增强中间层物化视图的表达能力,理论分析和初步原型实验证明方法的有效性。  相似文献   

3.
物化视图是减少数据仓库中查询响应时间的有效方法.现有的物化视图选择策略主要考虑物化视图的初始选择方法以及动态更新方法.针对某时间段内查询进行物化视图更新的情况考虑不足,在贪心算法以及动态更新算法的基础上,提出了基于时间段内查询的物化视图更新策略.基于时间段查询的物化视图更新策略可充分适应用户需求,提高查询效率.  相似文献   

4.
实体化视图是数据仓库中提高查询效率的有效手段,数据仓库运行期间,需要对其中的实体化视图进行维护,从而保证用户查询的响应时间较短。针对用于实体化视图动态选择的遗传算法收敛速度慢,运行时间长的问题,提出一种预处理算法来计算动态选择实体化视图时遗传算法的初始群体。理论分析和宴验结果表明,该算法可以有效地提高实体化视图动态选择时的寻优收敛速度。  相似文献   

5.
数据仓库中存放的是大量的实视图,文章利用实视图技术来优化查询。在分析传统优化查询方法的基础上,对其进行改进和扩展,给出了在数据仓库中使用实视图进行优化查询的方法和策略,以有效提高数据仓库的查询处理速度。  相似文献   

6.
数据仓库中多视图环境下的联机维护   总被引:3,自引:0,他引:3  
数据仓库的视图联机维护是指数数据仓库中的实体化视图实时地与信息源中的数据库仑保持一致,同时不影响前端用户对数据仓库的正常使用。为了解决多视图环境中视图联机维护与下钻查询的一致性问题,文中在数据仓库体系结构中引入了“基库”模型,并提出了相应的视图维护算法3VPA。  相似文献   

7.
李凌燕  杭晓骏 《微机发展》2007,17(8):130-132
联机分析处理(OLAP)是伴随着数据仓库出现的一种数据分析处理技术,其特点是使分析人员能够更充分地利用数据仓库中的数据资源,从多种角度、多个层次,快速地构建易为用户理解的并全面反映企业行为特征的数据快照,从而可使用户更加深入地了解企业的发展状况和趋势。ROLAP是OLAP中使用最广泛的一种类型。文中对影响ROLAP查询效率的关键技术进行了讨论,提出了一个改进的实视图动态选择算法。该算法从存储空间、查询频率、更新代价三个方面综合评价每个实视图,有效地保证了ROLAP查询的响应时间。  相似文献   

8.
联机分析处理(OLAP)是伴随着数据仓库出现的一种数据分析处理技术,其特点是使分析人员能够更充分地利用数据仓库中的数据资源,从多种角度、多个层次,快速地构建易为用户理解的并全面反映企业行为特征的数据快照,从而可使用户更加深入地了解企业的发展状况和趋势。ROLAP是OLAP中使用最广泛的一种类型。文中对影响ROLAP查询效率的关键技术进行了讨论,提出了一个改进的实视图动态选择算法。该算法从存储空间、查询频率、更新代价三个方面综合评价每个实视图,有效地保证了ROLAP查询的响应时间。  相似文献   

9.
数据仓库通常要对大量的数据进行运算,以精简的结果来回答用户的查询,这一特点使得物化视图技术在数据仓库中尤为重要.然而现有支持物化视图自动选择的方法是静态的,它违背了联机分析处理(OLAP)和决策支持系统(DSS)的动态本质.本文提出了可扩展的动态物化视图方法,通过将整个物化视图选择问题(MVS)分解为三个阶段,降低了问题的复杂度,提高了物化视图的有效性.通过动态调整,物化视图能即时适应查询需求.算法复杂度分析证明了方案的可扩展性.动态调整算法模拟实验验证了方案具有很好的自适应性.  相似文献   

10.
分组聚集查询已成为数据仓库领域研究的核心问题之一,实视图是提高分组聚集查询性能的有效手段。利用维属性间的层次关系,对一般意义上的实视图重写查询进行了扩展,讨论了单一视图重写查询的限制条件,并给出重写方法,在此基础上,提出了一种利用多个实视图重写查询的优化选择算法,并通过实验表明,该算法进一步提高了分组聚集查询效率。  相似文献   

11.
多维数据分析是数据仓库系统需要具备的一个主要功能,它接受用户的多维数据查询请求,生成多维数据集,为建立数据挖掘模型提供基础数据。本文提出一种分级存储数据的多维分析方法,实现分布式多维数据的报表展现原型系统,解决分布式环境下数据的即时展现应用问题,为分布式数据的统计展现提供了多角度、多层次和直观性的分析手段。  相似文献   

12.
文中分析了目前面向对象的程序设计方法学存在的结构异常、代码重用难等问题。  相似文献   

13.
物化视图选择的预处理算法   总被引:4,自引:1,他引:4  
现有的静态物化视图选择算法的视图搜索代价较大,而导致算法的时间复杂度偏高,不能用于对物化视图进行在线动态调整.提出了一种物化视图选择的预处理算法——PMVS,其中包括用户查询集动态调整算法QSDM、候选视图格构造算法CVLC和候选视图筛选算法CVF,该算法可用做预处理过程对视图数量进行在线压缩,从而降低了静态算法的视图空间搜索代价和时间复杂度.理论分析和实验结果表明该算法是有效可行的.  相似文献   

14.
对数据仓库多维视图进行容量估计是数据立方体设计,数据仓库存储规划和实现查询优化的基础,首先以统计理论为基础,提出了一种基于采样的数据仓库数据立方体空间估计策略,该策略针对不同类型的多维视图,对样本统计结果采用不同的空间放大策略,确保了估计结果具有较高的准确性,同时,该策略在最大估计的基础上采用一些启发式规则,对估计视图集进行有效的约简,并对估计过程中采用了样本视图预物化思想,根据预物化视图集生成优化的立方体空间估计序列,从而大幅缩短了整体估计时间。  相似文献   

15.
互联网技术不断发展,新浪微博作为公开的网络社交平台拥有庞大的活跃用户. 然而由于用户数量庞大,且个人信息并不一定真实,造成训练样本打标困难. 本文采用了一种多视图tri-training的方法,构建三个不同的视图,利用这些视图中少量已打标样本和未打标样本不断重复互相训练三个不同的分类器,最后集成这三个分类器实现用户性别判断. 本文用真实用户数据进行实验,发现和单一视图分类器相比,使用多视图tri-training学习训练后的分类器准确性更好,且需要打标的样本更少.  相似文献   

16.
针对各种异构和层次化的Web数据提出了Web数据仓库化模型--MIX数据模型,它是基于语义对象概念的自述型模型,能把Web页面各种异构数据统一起来,完成数据集成,按数据仓库预定义的模式载入数据仓库,较好地解决了派单式营销中Web数据进入数据仓库的难点问题.  相似文献   

17.
秦学勇  姚燕生 《微机发展》2006,16(12):136-138
当大量复杂异构的数据不断进入数据仓库以后,最初的配置渐渐适应不了新的环境,因此数据仓库必须要设计成为可扩展的体系结构,从而能够满足将来数据仓库的性能要求,它能够随着数据、最终用户、复杂性和功能性的增长而增长,并且在增长的同时其性能水平并不会下降。文中通过对数据集成、高效查询和非规格化等几个可扩展数据仓库关键问题进行研究,使得当大量异构数据涌入可扩展数据仓库中时系统性能不会下降,很好地满足决策支持,取得较好效果。  相似文献   

18.
Visualization of high‐dimensional data requires a mapping to a visual space. Whenever the goal is to preserve similarity relations a frequent strategy is to use 2D projections, which afford intuitive interactive exploration, e.g., by users locating and selecting groups and gradually drilling down to individual objects. In this paper, we propose a framework for projecting high‐dimensional data to 3D visual spaces, based on a generalization of the Least‐Square Projection (LSP). We compare projections to 2D and 3D visual spaces both quantitatively and through a user study considering certain exploration tasks. The quantitative analysis confirms that 3D projections outperform 2D projections in terms of precision. The user study indicates that certain tasks can be more reliably and confidently answered with 3D projections. Nonetheless, as 3D projections are displayed on 2D screens, interaction is more difficult. Therefore, we incorporate suitable interaction functionalities into a framework that supports 3D transformations, predefined optimal 2D views, coordinated 2D and 3D views, and hierarchical 3D cluster definition and exploration. For visually encoding data clusters in a 3D setup, we employ color coding of projected data points as well as four types of surface renderings. A second user study evaluates the suitability of these visual encodings. Several examples illustrate the framework's applicability for both visual exploration of multidimensional abstract (non‐spatial) data as well as the feature space of multi‐variate spatial data.  相似文献   

19.
董骏  冯锋 《计算机应用研究》2021,38(7):2072-2076
针对用户终端数据卸载过程中难以同时实现高隐私安全和低时间消耗的目标,提出了一种具有隐私保护的边缘计算高效数据卸载方法.首先,利用时间计算模型和隐私熵值分别将用户终端时间消耗和数据隐私安全程度进行量化,并建立一个多目标优化问题模型;其次,利用改进强度帕累托进化算法对时间消耗和隐私熵值进行联合优化;最后,利用基于熵权法的多属性决策方法选取最优的时间消耗和隐私熵组合策略.在多终端用户多计算任务的边缘计算下展开实验研究和对比分析,结果表明,该方法在降低传输时间的基础上还增强了数据卸载传输的安全性.  相似文献   

20.
Joseph Fong  Herbert Shiu  Davy Cheung 《Software》2008,38(11):1183-1213
Integrating information from multiple data sources is becoming increasingly important for enterprises that partner with other companies for e‐commerce. However, companies have their internal business applications deployed on diverse platforms and no standard solution for integrating information from these sources exists. To support business intelligence query activities, it is useful to build a data warehouse on top of middleware that aggregates the data obtained from various heterogeneous database systems. Online analytical processing (OLAP) can then be used to provide fast access to materialized views from the data warehouse. Since extensible markup language (XML) documents are a common data representation standard on the Internet and relational tables are commonly used for production data, OLAP must handle both relational and XML data. SQL and XQuery can be used to process the materialized relational and XML data cubes created from the aggregated data. This paper shows how to handle the two kinds of data cubes from a relational–XML data warehouse using extract, transformation and loading. Copyright © 2008 John Wiley & Sons, Ltd.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号