首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
提出了一种新的封闭立方体查询算法,缩小了查询时需搜索的记录的范围,提高了查询效率。给出了相关的理论分析和证明,并给出相关的封闭掩码集生成算法。实验结果和理论分析证明了新算法是有效的,在75%的情况下能将需查询范围包含的记录数减少到传统方法的92%左右,提高了对封闭立方体的查询效率。  相似文献   

2.
针对复杂立方体查询中可能存在的3种聚集依赖(完全依赖、部分依赖和互斥依赖),分别提出了3种基于Cache重用技术的解决方法:完全Cache重用、部分Cache重用以及反Cache重用机制,并相应地给出了计算方法和算法.在模拟和真实数据集上的实验结果表明,不同数据集下改进算法均比基本算法的效率有明显提高,特别地,数据量越大,Cache重用技术的优越性越明显.  相似文献   

3.
在数据仓库的联机分析处理的查询处理中,经常会涉及到大量数据的复杂即席查询.用户通过提交联机分析处理查询对数据进行分析和决策支持,这通常需要较快的查询响应速度.因此,提高联机分析处理的查询性能就成为了数据仓库领域的关键问题.为了提高数据仓库的查询性能,结合维表层次结构的特点,提出一种将分段位图索引和位图连接索引有效结合的方法.实验证明,该方法节省了位图索引的储存空间,减少了I/O开销,有效地提高了数据仓库的查询效率.  相似文献   

4.
范围查询是数据立方体数据分析的有效工具,预计算技术通过预先计算并存储范围查询的结果,可以实现快速的用户响应。近年来研究人员对基于MOLAP的预计算技术的研究主要以prefix sum及分块技术为基础。本文对预计算技术的分块方法进行研究,分析了现有分块技术的方法和性能,并提出了两种新的分块方法:嵌套分块和基于前缀区域边界的分块。本文对这两种分块的方法和特点做了阐述,研究表明这两种方法为分块技术提出了新的思路,是对现有分块方案的有力补充。  相似文献   

5.
维空间的Skyline查询处理技术是近年来数据库技术领域的一个研究重点和热点.目前所有的研究工作都是直接在原始数据表上执行关系查询代数操作来获得最终的结果集,然而,随着原始数据表的数据量和维目标个数的增大,这些研究工作将不再适用.基于此,首次研究Skyline集合上的查询代数操作,使得Skyline查询处理的输入数据来自于小规模的Skyline结果集,而非海量的原始数据表.并且,首次给出一个集成多维对象集合和该对象集合上的Skyline结果集的形式化模型,该模型适合目前Skyline查询计算的应用,并在该模型的实例上研究Skyline集合的查询代数操作.同时,给出查询代数体系的代价评估模型.实验表明,给出的数据模型和查询代数体系具有有效性和实用性.  相似文献   

6.
王黎明  程晓  柴玉梅 《计算机应用》2010,30(8):2013-2016
在属性基数(该属性可能的取值数)很高的情况下,简单位图索引需要占用太大存储空间。Bin位图索引可以很好解决这个问题。这种索引不像简单位图索引那样建立在不同的属性值上,而是建立在属性范围上,但候选检查往往占用大部分的查询时间。为了提高查询性能,提出一种排序方法来对各属性进行排序,以减少候选检查数目,并在此基础上提出动态预扫描算法。实验结果表明,排序和动态预扫描算法都取得了良好的效果。  相似文献   

7.
随着原始数据记录数的增多,数据立方体在存储空间和计算时间上的消耗都越来越大,封闭立方体是减少数据立方体的存储空间的有效手段。提出一种新的封闭数据立方体的生成算法,针对大量的原始数据集,通过预处理,采用类似BUC算法的计算顺序自上而下递归输出封闭单元,使用实际数据做了相关研究的实验,实验结果表明该算法能有效提高生成速度。  相似文献   

8.
一种基于立方体的复杂查询的高效算法*   总被引:2,自引:0,他引:2  
提出一种高效的整体多特征方查询算法.该算法首先将数据立方体水平分块成多个小数据集,然后将各子查询中的聚集函数分类,并对其中的分布和代数聚集函数使用分布聚集特性优化计算,使得整体多特征方查询可以局部使用分布多特征方查询的优化计算方法.实验结果证明该方法可以有效地提高整体多特征方查询的效率.  相似文献   

9.
缓存敏感的封闭冰山立方体计算   总被引:1,自引:0,他引:1  
栾华  杜小勇  王珊 《软件学报》2010,21(4):620-631
数据立方体计算通常会产生大量的输出结果,冰山立方体和封闭立方体是解决这个问题的比较流行的两种策略,二者可以结合使用.鉴于封闭冰山立方体(closed iceberg cube)的重要性和实用性,如何高效地计算封闭冰山立方体是一个值得研究的问题.提出一种缓存敏感(cache-conscious)的计算封闭冰山立方体的方法,在自底向上对数据进行聚集的同时,寻找覆盖聚集单元的封闭单元,将其输出,使用两种策略进行剪枝,去掉不必要的递归,同时使用Apriori剪枝技术,支持冰山立方体(iceberg cube)的计算.为了减少与内存相关的延迟,快速得到聚集结果,对多个维进行预排序,并将软件预取技术引入到数据扫描中.在模拟数据和真实数据上进行了详细而全面的实验研究,结果表明,封闭冰山立方体的计算方法是快速、有效的.  相似文献   

10.
封闭立方体是联机分析处理中一种有效的数据立方体压缩技术,但封闭立方体的并行算法目前很少有相关文献研究.提出了一种简单而实用的解决方案,即基于MapReduce计算框架,在非共享内存的PC集群上对封闭立方体进行分布式的预计算和查询.相关实验表明,本方法能快速处理千万级的数据,具有较好的线性加速比,而且能够更大地压缩数据立方体存储空间.  相似文献   

11.
阮卫华 《软件》2014,(7):72-77
本文简单的介绍了搜索引擎的概念、工作原理以及分类,同时对网站设计影响搜索引擎优化的因素进行了一定的探讨。  相似文献   

12.
The topology of interconnection networks plays an important role in the performance of parallel and distributed computing systems. In this paper, we propose a new interconnection network called twisted crossed cube (TCQn) and investigate its basic network properties in terms of the regularity, connectivity, fault tolerance, recursiveness, hamiltonicity and ability to simulate other architectures, and so on. Then, we develop an effective routing algorithm Route (u, v) for TCQn that takes no more than d(u, v) + 1 steps for any two nodes (u, v) to communicate with each other, and the routing process shows that the diameter, wide diameter, and fault‐tolerant diameter of TCQn are about half of the corresponding diameters of the equivalent hypercube with the same dimension. In the end, by combining TCQn with crossed cube (CQn), we propose a preferable dynamic network structure, that is, the dynamic crossed cube, which has the same network diameter as TCQn/CQn and better properties in other respects, for example, its connection complexity is half of that of TCQn/CQn when the network scale is large enough, and the number of its average routing steps is also much smaller than that in TCQn/CQn. Copyright © 2015 John Wiley & Sons, Ltd.  相似文献   

13.
最近涌现了各种进化方法来解决多目标优化问题,分散搜索也是一种可以解决多目标问题的算法。该算法的结构引用进化算法的杂交和变异算子来增强它的性能,但该算法与其他进化算法的不同在于一系列操作策略不再基于随机性原理,而是运用“分散-收敛集聚”的迭代机制。论文在多目标优化问题区域讨论分散搜索算法,寻找多目标的非支配集或Pareto最优解。实验表明,分散搜索算法具有很好的收敛性和分布性。  相似文献   

14.
一种混合搜索的粒子群算法   总被引:2,自引:0,他引:2  
连志刚  焦斌 《控制理论与应用》2010,27(10):1404-1410
本文通过对粒子群算法个体极值、全局极值和种群极值的结合,提出一种混合搜索粒子群算法.用典型的非线性测试函数进行仿真,其实验数据和收敛曲线验证了该算法的有效性,具有快速收敛效果和寻优能力.  相似文献   

15.
针对开源搜索引擎ASPSeek中的倒排索引的内部结构和访问模式,抽象出了倒排索引的形式化定义。为解决ASPSeek倒排索引更新困难和直接采用操作系统文件缓冲访问机制带来的效率问题,以125万张中文农业网页为样本,结合其特点,提出了一种块大小可变的分块倒排索引存储模式和基于CLOCK替代策略的专用缓冲管理机制。实验结果表明在禁用和启用缓冲的情况下,分块访问模式检索效率都优于ASPSeek。在启用缓冲并使用16万中文词条或5万高频中文词条作为测试集合的条件下,分块存储模式在访问倒排索引100万次后的检索时间趋于常量,即使以全部的827309个词条作为测试集合的条件下,分块存储模式在访问倒排索引200万次后的检索时间趋于收敛。  相似文献   

16.
搜索引擎的混合索引技术   总被引:5,自引:0,他引:5  
倒排文件是搜索引擎检索系统普遍采用的索引技术。针对中文搜索引擎中采用自动分词的全文检索因分词词典规模小导致的检索效率下降与词典规模扩大导致检索效果下降的矛盾,论文在天网搜索引擎的实践基础上,提出了一种基于倒排文件实现的混合索引的方法,它可以有效提高搜索引擎下短语查询的检索效率,同时不影响系统检索效果。  相似文献   

17.
将禁忌搜索和遗传算法相结合,给出了一种求解优化问题的混合策略--禁忌遗传优化算法.该算法一方面为禁忌搜索找到了较好的初始点,减少了调用禁忌搜索的次数,另一方面也可以克服遗传算法爬山能力差的缺点,从而加快了收敛速度,提高了解的质量.通过实例验证了该优化算法的有效性和可靠性,并将其用于网络拥塞控制的研究中,为进一步实施网络拥塞控制提供了一种有效的途径.  相似文献   

18.
从两个不同的角度对各种进化算法进行剖析,寻求合理的解释.从信息论的角度进行讨论,分析了在算法设计中如何表示信息.提取信息、传递信息,利用信息与信息融合等问题,在优化技术与信息论之间建立了联系的纽带.从搜索的角度进行讨论,分析了单点搜索与多点搜索,指出了各种进化算法均属于随机布点,企图寻找全局最优的数值方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号