排序方式: 共有105条查询结果,搜索用时 15 毫秒
41.
基于XML数据立方的面向对象扩展 总被引:3,自引:0,他引:3
本文是对基于XML的数据立方数据模型的面向对象的实现,通过对数据仓库技术,面向对象技术和XML技术的结合的探讨,扩展了XML Schema,从而为基于WEB数据仓库的应用提供了一种新的表示和实现方法,解决了数据仓库中模式演化所带来的重组问题,通过与面向对象技术的结合使用,把数据仓库变成为数据立方和OLAP方法的仓库,这种数据仓库的实现方案,保证了数据仓库系统的稳定性,灵活性和可扩展性,适应了新一代WEB应用的需要。 相似文献
42.
43.
Internet上的数据库联合查询优化 总被引:19,自引:0,他引:19
Internet是一个大型1自治的分布式系统,其结点正日益成为数据库系统,Internet形成的新环境要求重新考虑现行分布式数据库技术的许多概念,文中对Inernet上--类重要的查询--联合查询作了代娄分析,指出联合查询的优化是一个NP完备问题,然后提出酌情处理较低的启发式查询优化算法,采取“扩展半连接”的思路降低通信费用,以“本地析取、异地合取”的策略减少响应时间。 相似文献
44.
以往数据清洗工具在三个方面存在不足:工具和用户之间缺少交互,用户无法控制过程,也无法处理过程中的异常;数据转化和数据清洗规则缺少逻辑描述,没有达到与物理实现的分离;缺少元数据管理,用户很难分析和逐步调整数据清洗过程。文中提出了一种新的基于规则描述的交互式数据清洗框架,解决了上述三个方面存在的不足,提高了数据清洗的效率,使得数据的质量得到保证。并通过描述清洗规则的定义和执行,详细阐述了该清洗框架的结构。 相似文献
45.
与传统关系数据库不同,数据流管理系统主要处理并发的连续查询.由于查询可能随时增删,所以其主要关注适合查询增删的并发连续查询优化,而不是单条查询优化.提出适合频繁增删查询环境下的数据流窗口连接优化算法.对于新注册的查询以类似最小生成树算法写出数据流的探测序列,然后在不更改其他查询探测序列顺序的情况下尽量合并,减少重复计算.注册或删除查询并不影响其他的查询计划,不需要执行繁琐的查询计划迁移.理论分析和实验证明,该算法简单,优化性能在可接受的范围内,尤其适合查询更新频率较高的系统. 相似文献
46.
多数据流滑动窗口并发连接方法 总被引:9,自引:1,他引:9
提出一种多数据流滑动窗口连接方法M3Join及其实现架构Roujoin. Roujoin由一个连接路由表和多个连接区组成,其内容根据并发连接请求设置,先将新元组插入缓冲区,然后根据其路由标记查找连接路由表进入合适的连接区执行连接或输出给用户.如果产生连接元组,则更改其路由标记后送回连接路由表,并反复迭代直到没有连接元组.由于共享中间结果,在处理多个并发查询时只需扫描流元组一遍.实验结果表明M3Join具有良好的性能,能够满足并发连接查询处理的需求. 相似文献
47.
一种基于扩展时间Petri网的工作流时间性能评价方法 总被引:6,自引:0,他引:6
时间性能分析是工作流模型分析和评价的重要方面.首先介绍了业务过程的一般Petri网模型,然后建立了工作流网的扩展时间模型,在可达图的基础上提出了简单路径图和可变换子网的概念,利用保持网响应时间和分配概率不变的网变换方法对扩展时间工作流网进行化简,给出了找出可变换子网的算法和计算工作流模型时间性能指标的方法. 相似文献
48.
数据仓库系统中一种改进的维层次聚集Cube存储结构 总被引:3,自引:0,他引:3
提出利用Cube中的维层次(dimension hierarchy)聚集技术来创建高性能的维层次聚集Cube(dimension hierarchy aggregate cube, DHAC).充分利用DHAC已保存的维层次信息,对Cube中多维数据的查询和更新效率进行了优化,并且支持Cube的上探、下钻等语义操作.在DHAC中进行数据插入和删除等数据更新时,由下向上用更新前后的差值对受到更新结点影响的所有祖先结点进行增量更新.实现了在插入新维或维层次时不需要重新构建聚集Cube就可以实现Cube的模式更新.对维层次聚集Cube与传统Cube进行了算法性能分析和比较,理论分析和实验结果都表明,所提出的DHAC性能最佳. 相似文献
49.
在Data Cube语义特性及模式中维的层次性基础上提出了多维数据之间的等价关系≡\\-{HCov},对Data Cube进行层次聚类.该方法的优点在于用等价类的方法保存了所有聚集记录,同时定义了等价类之间的关系,以保存聚集记录之间的层次信息.理论分析和实验证明,该方法不但节省了存储空间,而且利用聚类信息及层次信息,可高效的进行各种OLAP查询,以及支持多维数据上的上钻下钻、旋转等Cube语义操作.同时,为OLAP查询导航、OLAP查询行为分析的实现提供了可能. 相似文献
50.
挖掘数据流中的频繁模式 总被引:17,自引:1,他引:17
发现数据流中的频繁项是数据流挖掘中最基本的问题之一.数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用.针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法.算法采用数据分段的思想,逐段挖掘频繁项集,用户可以连续在线获得当前的频繁项集,可以有效地挖掘所有的频繁项集,算法尤其适合长频繁项集的挖掘.通过引入误差ε,裁减了大量的非频繁项集,减少了数据的存储量,也能保证整个数据集中项目集支持度误差不超过ε. 分析和实验表明算法有较好的性能. 相似文献