首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 78 毫秒
1.
提出了一种新的用于估算查询结果大小的直方图方法。方法的基本思想与人类的思维机制是一致的,即在划分数据时,使所有直方开始于相对前一直方发生较大波动的项,并且结束于相对本直方发生较大波动的项之前。关于新的直方图方法,该文进行了大量的模拟实验。实验结果表明,该直方图方法估算精确,实现效率高,有较好的实用价值。  相似文献   

2.
限定误差的直方图   总被引:6,自引:0,他引:6  
吴胜利 《计算机学报》1998,21(8):704-712
限定误差的直方图方法以任意给定的误差作为前提,生成满足要求的直方图。本文在作者已有工作的基础上,进一步探讨生成限定误差直方图的方法,以适用于等值和范围两种查询,并进行了大量的模拟实验。实验结果表明,限定误差的直方图不仅估算精确,肯定能满足预定的要求,而且算法简单,实现效率高,具有良好的应用前景。  相似文献   

3.
直方图是许多商用数据库系统中最常用的一种估算查询结果大小的方法。作者在已有的研究基础上对限定误差直方图作了进一步研究,提出了一种新的限定误差直方图的算法。与以往限定误差直方图算法比较,生成的直方数进一步减少。并通过实验验证了新算法的时间复杂度接近线性。  相似文献   

4.
面向对象数据库中查询代价的估算   总被引:4,自引:0,他引:4  
好的查询优化器都是基于代价的,因此查询代价的估算是数据库查询优化中一项不可缺少的工作。文中在联系代数的基础上,综合考虑了对象聚集,索引等因素,给出了面向对象数据库中查询代价的一种估算方法。  相似文献   

5.
郭平  陈海珠 《计算机科学》2004,31(12):65-67
空间数据固有的复杂性使空间数据查询效率成为了空间信息处理和应用的关键与瓶颈,以查询代价估算为基础的查询优化技术是提高查询效率的一种重要方法。本文分析比较了几种主要的查询代价估算模型,指出了它们的使用范围与存在的问题,最后展望了空间查询代价模型研究的发展趋势。  相似文献   

6.
直方图是数据库系统中最常用的估算查询代价的一种工具,它将关系中的全部元组进行归类设桶,对每个桶分别进行大小统计,继而求和,使代价统计值更接近于真实。直方图方法在所有代价估计法中是最容易使用和最容易维护的,每一种直方图在代价估计精度上各不相同,使用中也各有其特点。结合实际课题应用,给出了将关系的连接转换为多种直方图的方法,以及如何利用直方图进行代价估计。  相似文献   

7.
空间查询优化是空间数据库中的关键问题之一,以查询代价估算为基础的查询优化技术是提高查询效率的一种重要方法,而估算代价的主要问题是估算查询结果(选择率)的大小。针对空间数据库中最常用的两种查询—空间选择和空间连接,阐述了几种主要用于查询选择率佑计的直方图算法,并对各算法的优缺点做了分析,最后对空间查询选择率估计的研究方向进行了展望。  相似文献   

8.
MS SQL Server查询系统及系统优化方法的研究   总被引:1,自引:0,他引:1  
查询优化是数据库系统设计时要考虑的重要方面,使用SQL进行数据库查询时,也有许多影响系统性能的因素。本文讨论了关系数据库处理高级查询的步骤和几种不同的查询优化方法,介绍了Microsoft SQL Server的基于成本的优化器所采用的优化策略,并讨论了影响Microsoft SQL Server性能的几个因素和解决方法。  相似文献   

9.
目前,用来估算查询选择性的最有效的技术是直方图技术。通过特定的改进,直方图也可应用到时空查询优化中。TPR 树在对未来预测的时空索引中显示了很好的优越性。结合TPR 树索引结构,构建满足时空查询的直方图,估算时空查询的选择性。  相似文献   

10.
分布式数据库系统的查询优化,就是要寻找执行代价最小的查询执行策略,使系统执行效率达到最高。我们在应用中需要选择适当优化方法,在执行代价和便捷度之间得到最佳执行方案。  相似文献   

11.
We propose a new approach to the estimation of query result sizes for join queries. The technique, which we have called systematic sampling—SYSSMP, is a novel variant of the sampling-based approach. A key novelty of the systematic sampling is that it exploits the sortedness of data; the result of this is that the sample relation obtained well represents the underlying frequency distribution of the join attribute in the original relation.We first develop a theoretical foundation for systematic sampling which suggests that the method gives a more representative sample than the traditional simple random sampling. Subsequent experimental analysis on a range of synthetic relations confirms that the quality of sample relations yielded by systematic sampling is higher than those produced by the traditional simple random sampling.To ensure that sample relations produced by systematic sampling indeed assist in computing more accurate query result sizes, we compare systematic sampling with the most efficient simple random sampling called t_cross using a variety of relation configurations. The results obtained validate that systematic sampling uses the same amount of sampling but still provides more accurate query result sizes than t_cross. Furthermore, the extra sampling cost incurred by the use of systematic sampling pays off in a cheaper query execution cost at run-time.  相似文献   

12.
This paper describes a novel approach to estimate the size of database query results using neural networks. Using the proposed approach, three layer neural networks are constructed and trained to learn the cumulative distribution functions of attribute values in relations. With a trained network, the estimation of the query result size could be obtained instantly by simply computing the network output from the given query predicates. The basic computational model using a cumulative distribution function to compute the query result size is described. The network construction and training is discussed. Comprehensive experiments were conducted to study the effectiveness of the proposed approach. The results indicate that the approach produces estimates with accuracies that are comparable with or higher than those reported in the literature.  相似文献   

13.
直方图是一种重要的数据查询工具.在数据库操作中查询操作需要进行代价估计,而操作代价的估计有多种方法.直方图估计法在所有估计法中是最容易使用和最容易维护的,它将关系中的全部元组进行归类设桶,对每个桶分别进行大小统计,继而求和,使代价统计值更接近于真实.结合实际课题应用,给出了将关系的连接转换为多种直方图的方法,以及如何利用直方图进行代价估计.  相似文献   

14.
基数估计是实现数据库多表连接(JOIN)查询优化的重要手段之一。对数据量较大的数据表进行基数估计时常用数据抽样来获得较小的样本,从而估计各种查询负载下所需的数据基数。在单表上利用数据抽样来完成基数估计的方法已经得到广泛研究,但在多个数据表的抽样样本总体存储预算存在限制时,目前仍缺乏有效的多表间样本数划分方法使得整体基数估计达到较优。为此,提出一种面向多表JOIN查询优化的基数估计方法,针对一组给定的含有复杂多JOIN操作的查询负载,为其合理分配数据库中每个表的抽样率,从而在满足样本大小总和限制的同时使得基数估计准确率达到最高。将上述过程抽象为一个抽样率分配搜索问题,在数据库数据抽样问题中引入贝叶斯优化搜索算法,利用该算法快速搜索出不同表之间抽样样本大小的分配比例,使得有限时间内获得的样本分配方案对应的基数估计准确率最高,从而达到查询优化的目的。在TPC-H数据集上的实验结果表明,在相同时间内确定多JOIN操作查询负载下基数估计准确率最高的抽样比例方案时,相比随机搜索算法,贝叶斯优化算法所得方案对应的基数估计误差率降低54.8%~60.2%。  相似文献   

15.
现代数据管理系统普遍存在劣质数据,影响了数据质量,给数据管理带来了新的挑战.已经有不少管理劣质数据的数据模型,实体关系数据模型就是其中一种,该模型允许劣质数据的存在,并给出衡量数据质量的方法,并且可根据对结果质量的需求给出查询结果.鉴于该模型的特点,传统的估计查询代价的优化方法很难再适用,需要新的代价估计技术.本文提出了一种新的估计连接结果大小的方法.使用加权的最小哈希函数获得某一属性的最小哈希签名,这使得属性具有相同维数,便于利用直方图进行快速估计;然后建立其直方图,最后使用改进的离散余弦变换压缩直方图信息,使用压缩信息直接进行代价估计,这使得即使对于高维数据也能保证低错误率和低存储代价.此外,此方法可以很好的支持动态数据更新,消除周期性重建直方图的时间开销.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号