排序方式: 共有105条查询结果,搜索用时 31 毫秒
51.
52.
53.
Internet上的数据库联合查询优化 总被引:19,自引:0,他引:19
Internet是一个大型1自治的分布式系统,其结点正日益成为数据库系统,Internet形成的新环境要求重新考虑现行分布式数据库技术的许多概念,文中对Inernet上--类重要的查询--联合查询作了代娄分析,指出联合查询的优化是一个NP完备问题,然后提出酌情处理较低的启发式查询优化算法,采取“扩展半连接”的思路降低通信费用,以“本地析取、异地合取”的策略减少响应时间。 相似文献
54.
55.
56.
高维数据流的在线相关性分析 总被引:6,自引:0,他引:6
为了解决在资源受限的计算环境下快速检测高维数据流之间相关性的问题,提出一种新颖的在线典型相关性分析(CCA)算法QuickCCA,针对传统CCA计算中的性能瓶颈,首先采用不等概列采样技术约减流元组的数量,形成概要矩阵;然后在概要矩阵的基础上增量地计算多维数据流之间的前k个典型相关系数.经理论分析和实验证明,QuickCCA能够在线精确地识别同步滑动窗口模式下多维数据流之间的相关性.与已有分析多数据流相关性的算法相比,QuickCCA显著地降低了计算复杂度,并且能够在精度和性能之间折中,可以作为通用的分析工具广泛应用于数据流挖掘领域. 相似文献
57.
以往数据清洗工具在三个方面存在不足:工具和用户之间缺少交互,用户无法控制过程,也无法处理过程中的异常;数据转化和数据清洗规则缺少逻辑描述,没有达到与物理实现的分离;缺少元数据管理,用户很难分析和逐步调整数据清洗过程。文中提出了一种新的基于规则描述的交互式数据清洗框架,解决了上述三个方面存在的不足,提高了数据清洗的效率,使得数据的质量得到保证。并通过描述清洗规则的定义和执行,详细阐述了该清洗框架的结构。 相似文献
58.
ETL执行的流水线优化 总被引:6,自引:1,他引:6
ETL工具是构建和维护数据仓库的基本构件,由于它处理的是海量数据.如何有效地加快响应时间成为值得研究的问题.本文提出了ETL过程的“主表衍生”模式.并针对这种模式采用流水线算法来提高并行性从而加快ETL过程的响应时间,理论分析和实验表明具有好的效果. 相似文献
59.
60.
多数据流滑动窗口并发连接方法 总被引:10,自引:1,他引:9
提出一种多数据流滑动窗口连接方法M3Join及其实现架构Roujoin.Roujoin由一个连接路由表和多个连接区组成,其内容根据并发连接请求设置,先将新元组插入缓冲区,然后根据其路由标记查找连接路由表进入合适的连接区执行连接或输出给用户.如果产生连接元组,则更改其路由标记后送回连接路由表,并反复迭代直到没有连接元组.由于共享中间结果,在处理多个并发查询时只需扫描流元组一遍.实验结果表明M3Join具有良好的性能,能够满足并发连接查询处理的需求. 相似文献