一种数据流上基于滑动窗口的点连接查询处理算法 |
| |
引用本文: | 杨仁凯,王坤朋,木伟民,王伟平.一种数据流上基于滑动窗口的点连接查询处理算法[J].计算机研究与发展,2014(Z1). |
| |
作者姓名: | 杨仁凯 王坤朋 木伟民 王伟平 |
| |
作者单位: | 中国科学院大学;中国科学院信息工程研究所; |
| |
基金项目: | 国家“八六三”高技术研究发展计划基金项目(2013AA013204,2012AA01A401);“核高基”国家科技重大专项基金项目(2013ZX01039-002-001-001);中科院“战略性先导专项”项目(XDA06030200) |
| |
摘 要: | 连接是数据库研究中至关重要的一环,在没有边界、连续的数据流模型中,由于存储有限和实时性需求,连接算法主要基于滑动窗口作近似处理.主要研究数据流上一种特殊的连接,命名为点连接.点连接是指对于任意r∈R(称为主流),有唯一的s∈S(称为副流)与之对应,其中s.a=r.a且s.time最接近r.time(time称为时间特征).因此,流R与流S上的数据属于n∶1的关系.而在真实的分布式环境下,因为网络等原因,流数据到达的时间和顺序往往不一致,导致连接成功率下降.提出一种新的连接查询处理算法,能够在复杂的网络环境下获取更多的连接输出.实验模拟了2种网络环境,分别在数据有序到达和数据乱序到达2种情况下对算法验证,证明此算法比已有算法更优.
|
关 键 词: | 数据流 数据库研究 点连接 滑动窗口 时间特征 |
本文献已被 CNKI 等数据库收录! |
|