共查询到20条相似文献,搜索用时 171 毫秒
1.
数据仓库中的事实数据一般以最小粒度存储。而大量的细粒度数据具有很大的随机性,很少直接进行分析和处理,往往被聚集到一定层次的粗粒度数据。另一方面若采用ROLAP存储数据,则大量的细粒度数据将会影响查询的效率。本文介绍了一种基于时间维层次查询频率的粒度调整模型,它能根据用户在时间维层次的查询频率实现对数据粒度的调整。 相似文献
2.
基于聚类的非清洁数据库的聚集查询处理算法 总被引:1,自引:0,他引:1
现实数据库中的不完整数据、不一致数据、重复数据等非清洁数据为数据库的有效使用带来了影响,从包含非清洁数据的数据库中得到满足清洁度要求的统计分析结果,为数据库研究带来了新的挑战,聚集查询是统计分析的基础.面向非清洁数据,提出了有清洁度保证的聚集查询处理算法,用于处理包含group by子句的聚集查询.考虑到在非清洁数据中,同一个元组可能属于不同的分组,提出的方法是利用可重叠聚类的方法将数据库中的元组加以分组,从而得到考虑数据非清洁性的分组,以及基于这些分组计算得到的聚集结果及其以概率表达的清洁度.提出的方法适用于多种聚集函数以及包含选择条件的聚集查询.通过实验验证了方法的效率. 相似文献
3.
在研究BUC算法的基础上探讨了维层次数据的计算方法,提出一种改进的雏层次计算方法,减小其排序开销,加快计算速度,从而提高聚集查询处理的性能. 相似文献
4.
在数据仓库、大量交易记录系统、移动计算、联机分析处理系统(OLAP)等许多领域中聚集数据的处理是一个非常重要的核心问题。该文首先分析了聚集数据查询的特点,引入了聚集查询语言和聚集查询重写;其次对于聚集查询环境下如何实现快速查询,给出了一个基于聚集数据的近似查询计算模型;最后将该计算模型应用于人口统计系统,从而实现对统计信息类数据进行快速的查询处理,获得有效的查询结果。 相似文献
5.
6.
提出了基于移动对象运动轨迹的时空立方体模型,在该模型中,移动对象的运动轨迹按一定时间间隔划分,每段运动轨迹对应一个最小外接时空长方体,它是存储,访问的一个基本单位.基于该模型设计了相应的时空索引和时空查询算法.验证表明,模型在减少数据冗余和时空查询性能方面有较大提高. 相似文献
7.
在联机分析处理(OLAP)中,有效地维度模型对海量数据的即席复杂分组聚集查询起着关键的作用.在偏序和映射的基础上,通过定义层次有序维,提出一种基于层次有序维的分组聚集算法.该算法利用维属性之间的聚集关系,通过约束层次链中的元素次序,实现了分组聚集计算中多表连接转换为维范围的查询,提高了连接和聚集效率.最后,实验结果验证了该算法的有效性. 相似文献
8.
9.
引进了一种新的 skyline 查询类型,不仅考虑最大/最小的硬属性,还考虑时间属性以及这些不同的属性类型之间的关系。找到时间属性和控制关系之间的相互关联,基于这一发现,定义了一种新的基于时间聚集的控制关系;利用时间聚集来分析和时间因素有关时,商品在竞争市场上的定位问题,并提出了一个有效地处理时间聚集控制关系查询的方法——角转换。实验使用真实数据和不同的合成数据,证明了这种新的查询类型确实是有意义的,提出的算法高效、可扩展。 相似文献
10.
在数据仓库以及联机分析处理等许多领域中,聚集数据的处理是一个非常重要的核心问题。本文分析了聚集数据查询的特点,引入了基于聚集数据的近似查询计算模型,并针对该计算模型的提纲构建问题,给出了一类近似查询提纲的Haar小波方法,来实现对聚集数据和聚集视图的快速查询计算。 相似文献
11.
12.
不同知识粒度下粗糙集的不确定性研究 总被引:27,自引:1,他引:26
粗糙集的不确定性度量方法,目前主要包括粗糙集的粗糙度、粗糙熵、模糊度和模糊熵.在不同知识粒度下,从属性的角度,给出了分层递阶的知识空间链,发现在分层递阶的知识粒度下部分文献中定义的粗糙集的粗糙熵和模糊度随知识粒度的变化规律不一定符合人们的认识规律.从信息熵的角度提出了一种粗糙集不确定性的模糊度度量方法,证明了这种模糊度随知识粒度的减小而单调递减,弥补了现有粗糙熵和模糊度度量粗糙集不确定性的不足.最后,分析了在不同知识粒度下粗糙度和模糊度的变化关系. 相似文献
13.
针对动态时间弯曲(DTW)算法在提高计算速度同时不能兼顾分类正确率的问题,提出了一种基于朴素粒计算思想的弹性粗粒度动态时间弯曲(CG-DTW)算法。首先,通过计算时序方差特征的方法来获取较优的时序粒度,用粒度特征代替原始序列;其次,再代入执行DTW算法,允许动态调整被比较时序粒间的弹性大小,从而获得相对最优的时序对应粒;最后,在对应最优粒的情况下计算DTW距离。同时引入下界函数的提前终止策略进一步提高CG-DTW算法效率。实验结果表明,所提算法要比经典算法运行速率提高21.4%左右,比降维策略算法正确率提高近32.3个百分点,尤其是长序列的分类,CG-DTW能够在保持正确率的情况下兼顾较高的运行效率。CG-DTW在实际应用中能适应不确定长序列分类。 相似文献
14.
15.
文章研究了基于粒度计算理论的数据分类建模,引入了全粒度空间的概念,定义了集合的粒度表示,给出了概念学习在粒度计算理论中的解释,导出了一个基于数据分类的知识发现模型,从而说明了知识发现可归结为在全粒度空间中寻找目标概念的最佳粒度表示,而各粒度描述的析取构成决策规则的前件。 相似文献
16.
Modeling Moving Objects over Multiple Granularities 总被引:3,自引:0,他引:3
Kathleen Hornsby Max J. Egenhofer 《Annals of Mathematics and Artificial Intelligence》2002,36(1-2):177-194
This paper introduces a framework for modeling the movement of objects or individuals over multiple granularities. Granularity refers to selecting the appropriate level of detail for a task. At fine granularities, spatio-temporal information is revealed that was not previously known, such as additional locations that an individual visited or multiple visits to the same location. Conversely, moving to a coarser granularity or simpler view generalizes spatial and temporal aspects of movement allowing for an improved understanding of movement. Movement is modeled as geospatial lifelines, time-stamped records of the locations that an individual has occupied over a period of time. Depending on the desired granularity, lifelines are modeled as lifeline beads, necklaces, or more general approximations of these structures and this paper examines how different aspects of lifelines become relevant at refined or coarse granularities. 相似文献
17.
通过研究已有的网格分割和模型简化方法 ,分析三维模型的网格分割中的商空间粒度思想 ,并将商空间粒度计算引入到网格分割中 ,对网格分割过程进行描述 ,提出了基于粒度分层合成技术的网格分割方法。该算法通过分别提取模型中各三角形网格区域的几何特征构成不同的粒度区域 ,再根据粒度合成理论。将这些所形成的粒度组织起来 ,从而实现对三维网格的最终分割 ,为三角网格模型的简化提供了快速有效的方法。实验表明了该算法对于网格分割的有效性和正确性。 相似文献
18.
粗糙集的不确定性度量在知识获取中扮演着非常重要的角色。在邻域粗糙集理论中,当前不确定性度量方面的研究工作主要专注于度量单个知识空间的不确定性及其随粒度变化的单调性规律,其仍存在以下缺点:1)邻域粗糙集不确定性来自于邻域粒中属于目标概念的元素和不属于目标概念的元素,当前的方法没有同时考虑每个邻域信息粒的这两部分;2)不能反映不同知识空间对目标概念刻画能力的差异性;3)由于当前的知识距离包含了粒度划分的信息,已有方法在一些应用场合下不够准确,例如属性约简中的知识启发式搜索及其粒度选择。对此,文中首先构建了一种更加直观准确的邻域粗糙集的不确定性度量方法——邻域熵,并证明了不确定性度量随着粒度的细化具有单调性;为了反映不同邻域信息粒对目标概念刻画能力的差异性,提出了一种带近似描述能力的邻域粒距离,称为相对邻域粒距离,并介绍了它的相关性质;针对分层递阶的多粒度知识空间中的粒度选择问题,建立了基于边界域的邻域知识距离度量模型,该知识距离可以反映不同邻域知识空间对目标概念的刻画能力的差异性。 相似文献
19.
时间粒度是所有时态数据所拥有的共同特点。在许多时态数据库应用中,都涉及多时间粒度约束,但是,具有多时间粒度的时态数据库的设计相当复杂,难以实现。而现实世界中的许多应用涉及到的时态类型集都能满足全序关系,由于具有全序时态类型集的全序时态模块模式有着良好的特性,文章提出了全序时态模块模式、时刻关系模式、全序时态模块投影和全序时态BC范式(TO_TBCNF)等概念,并给出了全序时态BC范式的分解算法,对其正确性、可终止性进行了证明,并对时间复杂度进行了分析。 相似文献
20.
Temporal Granularity: Completing the Puzzle 总被引:1,自引:0,他引:1
Iqbal A. Goralwalla Yuri Leontiev M. Tamer Özsu Duane Szafron Carlo Combi 《Journal of Intelligent Information Systems》2001,16(1):41-63
Granularity is an integral feature of both anchored (e.g., 25 October 1995, July 1996) and unanchored (e.g., 3 minutes, 6 hours 20 minutes, 5 days) temporal data. In supporting temporal data that is specified in different granularities, numerous approaches have been proposed to deal with the issues of converting temporal data from one granularity to another. The emphasis, however, has only been on granularity conversions with respect to anchored temporal data. In this paper we provide a novel approach to the treatment of granularity in temporal data. A granularity is modeled as a special kind of unanchored temporal primitive that can be used as a unit of time. That is, a granularity is modeled as a unit unanchored temporal primitive. We show how unanchored temporal data is represented, give procedures for converting the data to a given granularity, provide canonical forms for the data, and describe how operations between the data are performed. We also show how anchored temporal data is represented at different granularities and give the semantics of operations on anchored temporal data. 相似文献