首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 218 毫秒
1.
叶小平  汤庸  林衍崇  陈钊滢  张智博 《软件学报》2014,25(11):2587-2601
时态数据索引是实现时态数据有效管理的关键技术之一.讨论了一种时态数据结构及其在时态数据索引上的应用.常规的时态数据管理技术多基于代数框架.提出了一种基于拟序关系的时态数据结构,该结构能够像常规关系数据那样实现“一次一集合”的数据操作,并可通过多线程提高查询效率.在此基础上,研究了一种时态数据索引TQOindex.首先,提出时间期间集合上拟序关系和线序划分概念,讨论了线序划分的最优(最小)性质和构建算法,并在最小线序划分框架内研究时态拟序结构基于增量式更新的插入和删除算法.其次,研究了时态拟序结构应用——引入基于拟序扩展集的时态数据索引 TQOindex.该索引适用于磁盘(外存)数据管理,可在常规数据库平台上有效使用.其增量式更新机制可应用于“大数据”的动态索引技术.另外,对TQOindex进行了基本仿真,实验结果表明了该工作的可行性和有效性.提出的时态拟序数据结构着眼于新型数据,如语义数据、XML数据和移动对象数据中时态处理与整合机制,相应的工作具有较为广泛的应用扩展性.  相似文献   

2.
该文研究一种以语义为基本要素并实现"语义"、"时间"和"结构"处理协同联动的时态XML索引技术SCTindex.首先,以时态结点为数据处理逻辑单元,在时态结点集合上建立基于线序划分的时态数据结构,这种结构具有相应的"拟序关系"数学基础,便于推广,能够实现"一次一集合"的查询方式,具有较高的时间查询效率;其次,以结点语义标签为数据处理技术单元,建立语义标签归并集合,在语义层面配置基于线序划分的时间索引机制,体现了XML本体要素——"语义"与时态数据基本内涵——"时间"约束间的整合联动;另外,引入带有足够结构信息和能够实现"更新友好"的结点编码方案GDFC,建立了相应时态数据的结构连接算法,实现了"结构"与"语义"协同处理.论文主要贡献是基于计算机协同处理理念,较精细地分析时态XML数据的"语义"、"结构"和"时间"等查询要素的本体特征和内在关联,提出了具有较高查询效率的线序划分结构,同时将其配置在语义层面,实现了不同于常规的以"结构摘要"为主轴部署查询的索引模式.论文进行基本实验仿真,通过与现有相关工作进行比较评估,表明SCTindex的可行性、有效性和优越性.  相似文献   

3.
郭欢  叶小平  汤庸  陈罗武 《软件学报》2012,23(8):2042-2057
研究了一种基于时态编码和线序划分的时态XML索引机制.首先,提出一种基于扩展先序编码的时态编码方案,通过该编码可确定结点间的结构关系;其次,在深入分析时间区间关系的基础上引入线序划分的概念,并讨论了获取线序划分的算法;然后,建立了整合路径结构信息和时态约束信息的时态结构摘要,并在此基础上建立了时态XML索引结构—TempSumIndex,同时研究了基于TempSumlndex的时态XML查询和增量式更新算法;最后,对TempSumlndex和现有时态XML索引技术的基本性能进行了详细的实验评估.实验结果表明,TempSumlndex具有更为优越的性能.  相似文献   

4.
如何在XML文档中表达时间相关的数据,跟踪历史信息和恢复文档在以前任意时刻的状态的问题,在最近的研究中受到不少的关注.许多文献提出了各种不同的模型.我们将这一类的问题归为索引时态XML文档的问题.本文将时态XML文档转换到n维空间的节点和直线,使用UB-tree对这些 N维空间的节点和直线进行索引,并针对时态查询提出了新的查询算法.通过实验证明,这样的索引比之前针对时态模型提出的索引具有更好的性能.  相似文献   

5.
时态XML索引技术   总被引:2,自引:0,他引:2  
叶小平  陈铠原  汤庸  汤娜  胡苏 《计算机学报》2007,30(7):1074-1085
首先通过讨论时态XML查询数据模型TXQDM,提出了基于结点有效时间的前缀编码方案.以此为基础,引入TXQDM结点间的基于时态连通的等价关系和基于时态包含的拟序关系,建立了时态XML索引数据模型TXIDM,该模型的基本特征是具有二重嵌套的索引框架,适合于TXQDM这种不规则的具有较大随意性的树形结构情形.其次,在TXIDM框架内,讨论了相应时态查询算法,其中包括基于时态的路径查询和值查询,同时,还讨论了时态索引更新算法,其中包括插入和修改算法.最后,对于文中提出的模型TXIDM和时态索引操作算法进行了性能分析且设计了相应模拟实验.实验结果表明,基于TXIDM的时态查询与更新算法是可行的和有效的.  相似文献   

6.
杨佐希  汤娜  汤庸  潘明明  李丁丁  叶小平 《软件学报》2020,31(11):3519-3539
时态索引作为一种高效管理和检索时态数据的有效手段,一直是时态数据领域的研究热点.提出了一种基于时序分区的时态索引技术TPindex.首先将海量时态数据的时态属性映射到二维平面上,对平面上的“有效时间”点进行采样处理,通过使用自上而下,自左而右的时序分区方法将平面划分成若干个均匀的区域.其次,使用基于拟序关系的线序划分算法对每个分区中的数据构建数据结构,并建立基于“有效时间戳”的全区索引,实现“一次一集合”的数据查询操作.再次,还提出了使用分文件存储线序索引的模式将分区线序索引磁盘化,同时可以结合多线程技术并行处理数据,充分利用现代化硬件资源以满足海量数据下的高性能需求,提高索引性能.另一方面,我们还研究了海量时态数据下TPindex的增量式更新操作.最后,设计相应的仿真实验,通过与现有的代表性工作进行对比评估,验证了所提出方法的有效性和实用价值.  相似文献   

7.
本文研究如何有效地查询基于"单属性表示时态信息"的XML文档的时态信息操作,并选择XML功能较为强大的查询语言XQuery进行时态查询扩展.文中先计论如何解决时态数据库中特殊元素now的语义失真的问题,然后对XQuery进行双时态扩展,最后给出扩展后的查询实例.  相似文献   

8.
时空数据库和基于集群计算的时间分析工具大多基于外存,将其应用在大数据处理场景下系统性能将迅速降低。为此,基于Spark构建一个易用且高可扩展的时态大数据查询分析系统。通过扩展Spark SQL解析器,使其能够支持类SQL形式的时态操作,运用SIMBA开源项目的方法,引入全局过滤和局部时态索引2种优化策略,使得系统能以高吞吐量及低延迟执行时态查询操作。基于时态查询效率的评估实验结果表明,在不同影响参数下,该系统的时态查询性能优于原生的Spark SQL查询处理方案。  相似文献   

9.
目前B+树仍是在商业数据库中应用最广泛的基本索引结构,为在现有数据库平台上对时态数据进行有效操作,有必要研究基于B+树的时态索引技术.研究了一种以B+树为基本存储结构、基于结构摘要的时态索引方法Cmap-tree.首先,引入基于内存的结构摘要,通过存储结点必要的结构摘要信息,有效地降低了时态操作过程中对无效结点的访问;其次,提出了时态矩阵的概念,并以时态矩阵为参考详细分析了各时态关系对应的结果集;然后,在结构摘要的基础上,详细讨论了Cmap-tree的时态插入、查询和更新算法.最后,通过仿真实验,对Cmap-tree的空间利用率、查询效率和更新效率等基本性能与现有时态索引方法进行了比较和分析.实验结果表明,Cmap-tree具有明显优势.  相似文献   

10.
研究有效时间期间集合上数学关系以及时态索引构造与应用.建立时间期间集合上时态连通等价关系和时态包含拟序关系.在引入数学关系框架内,通过对时间期间特征进行精细分析,讨论了大时态连通等价类分割和时态包含拟序关系集重叠等问题,建立了由根结点、等价类分割集结点和拟序关系集线序分枝结点构成的时态索引树形模型TDIM.在TDIM架构下,基于时态数据库中数据实体动态管理基本特征,研究了具时态变量情况下时态索引动态实现机制和查询技术,同时讨论了时态更新(时态插入、时态删除和时态修改)的增量式算法.由于建立在一般时间集合之上,TDIM可以应用于时态关系和XML的数据管理.  相似文献   

11.
XML文档数据编码模式是XML文档查询处理的基础, 好的文档编码模式有利于提高文档的查询效率. 为了解决XML数据查询效率低、支持动态更新等问题. 本文在二叉树遍历的编码基础上, 引入二叉树的三叉链表存储结构对XML文档结点进行编码. 该编码利用自然数作为编码序号, 因此编码长度较短; 引入结点双亲指针, 方便结点之间结构关系的判定, 结点采用三叉树链式存储, 方便文档的更新操作.  相似文献   

12.
提出了一种基于B~+树的、针对有效时间区间的索引模式:FQM-tree(fast query map tree).FQM-tree将有效时间区间映射为一维空间上的点,对映射点建立索引;同时增加一个基于内存的辅助索引结构,最大程度地减少对无效节点的访问.该索引结构具有如下优点:首先,将时问区间映射为点,可以直接利用已有应用成熟的、被广泛支持索引结构(如B~+树),这就意味着可以在数据库中快速实现对时态索引的支持,而无需更改DBMS的内核;其次,基于内存的辅助索引结构可以直接定位叶节点,提高了时态查询效率;另外,由于当前B~+树仍是数据库中应用最成熟、最广泛的索引结构,因此借助B+树的基本结构研究时态索引,使得时态索引能够快速地得到具体应用,所以FQM-tree的研究具有广泛的应用价值.理论分析及大量的实验结果均表明,FQM-tree的查询性能优于传统的时态索引方法.  相似文献   

13.
XML已成为信息交换和表示的标准.对XML数据的查询将返回满足特定约束的XML节点子集.对于大文件的XML数据的查询处理通常分为两步:1.为该XML数据建立一个索引;2.在索引上完成查询处理无需访问源文档.XML索引为查询处理提供了高效的帮助,其中F&B索引是已知的处理分枝查询最小的索引,但快速创建F&B索引和利用F&B索引完成查询处理的算法却很少有人研究.提出了一种素数序列标记法,这种标记法不仅有助于快速地建立F&B索引,更可以高效地完成F&B索引上的查询处理.此外,还给出了F&B索引上的区间标记法与CCPI的创建过程,这两种编码创建过程无需在建立F&B索引后二次创建,仅需与F&B索引创建过程一起对文档使用SAX解析器分析一次即可得到.这样,可以在F&B索引的区间标记法上使用TwigStack算法执行查询处理,在F&B索引的CCPI标记法上使用关联路径连接算法执行查询处理.还给出了基于素数序列标记法的查询处理算法,即素数整除匹配算法,该算法可以高效地判定某节点是否有某分枝子结构.实验表明基于素数序列标记法的F&B索引创建方法比SAM算法快,在多个数据集F&B索引上素数整除匹配算法优于关联路径连接算法和Twi...  相似文献   

14.
Temporal XML: modeling, indexing, and query processing   总被引:1,自引:0,他引:1  
In this paper we address the problem of modeling and implementing temporal data in XML. We propose a data model for tracking historical information in an XML document and for recovering the state of the document as of any given time. We study the temporal constraints imposed by the data model, and present algorithms for validating a temporal XML document against these constraints, along with methods for fixing inconsistent documents. In addition, we discuss different ways of mapping the abstract representation into a temporal XML document, and introduce TXPath, a temporal XML query language that extends XPath 2.0. In the second part of the paper, we present our approach for summarizing and indexing temporal XML documents. In particular we show that by indexing continuous paths, i.e., paths that are valid continuously during a certain interval in a temporal XML graph, we can dramatically increase query performance. To achieve this, we introduce a new class of summaries, denoted TSummary, that adds the time dimension to the well-known path summarization schemes. Within this framework, we present two new summaries: LCP and Interval summaries. The indexing scheme, denoted TempIndex, integrates these summaries with additional data structures. We give a query processing strategy based on TempIndex and a type of ancestor-descendant encoding, denoted temporal interval encoding. We present a persistent implementation of TempIndex, and a comparison against a system based on a non-temporal path index, and one based on DOM. Finally, we sketch a language for updates, and show that the cost of updating the index is compatible with real-world requirements.  相似文献   

15.
Existing encoding schemes and index structures proposed for XML query processing primarily target the containment relationship, specifically the parent–child and ancestor–descendant relationship. The presence of preceding-sibling and following-sibling location steps in the XPath specification, which is the de facto query language for XML, makes the horizontal navigation, besides the vertical navigation, among nodes of XML documents a necessity for efficient evaluation of XML queries. Our work enhances the existing range-based and prefix-based encoding schemes such that all structural relationships between XML nodes can be determined from their codes alone. Furthermore, an external-memory index structure based on the traditional B+-tree, XL+-tree(XML Location+-tree), is introduced to index element sets such that all defined location steps in the XPath language, vertical and horizontal, top-down and bottom-up, can be processed efficiently. The XL+-trees under the range or prefix encoding scheme actually share the same structure; but various search operations upon them may be slightly different as a result of the richer information provided by the prefix encoding scheme. Finally, experiments are conducted to validate the efficiency of the XL+-tree approach. We compare the query performance of XL+-tree with that of R-tree, which is capable of handling comprehensive XPath location steps and has been empirically shown to outperform other indexing approaches.  相似文献   

16.
屈啸  王永利 《计算机科学》2012,39(6):170-174
随着物联网的发展,以RFID为代表的物联网传感器数据的存储、查询、处理等课题正成为研究的热点。结合数据仓库时空维度和列存储的思想,建立了一种列式RFID数据仓库,并根据RFID的时空特性,设计了一种支持连续聚集查询的多时空粒度数据结构和快速更新算法。它去除了传统聚集查询的部分冗余操作,适合处理大规模RFID数据仓库上的连续实时聚集查询。通过实验证明,该模型与算法在一些典型的物联网应用中取得了较高的效率,可广泛地适用于海量RFID数据仓库上的OLAP分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号