共查询到20条相似文献,搜索用时 125 毫秒
1.
基于SAX的XML数据结构聚簇存储方法 总被引:1,自引:0,他引:1
目前在存储XML数据时没有考虑数据之间的结构关系,但对其进行操作时往往需要涉及这些关系。该文在分析XML数据操作的特点后,提出基于SAX的编码解析算法,利用该算法遍历XML文档一次即可得到XML数据的三元组编码,以该编码为基础,提出2种XML数据的结构聚簇存储算法,通过实验对算法进行了分析和比较。 相似文献
2.
XML文档近似连接操作是在两个XML文档集合中发现近似的XML文档,其在基于XML数据的信息集成、XML数据清洗等系统中有着广泛的应用.然而,目前XML文档近似连接操作的一个显著问题在于:当文档之间存在较大差异时,存在大量的重复计算,降低了处理效率.对于这个问题,提出了基于聚类的XML文档近似连接方法,基本思想是为每个XML文档建立一个索引,如果两个数据集中若干文档的索引较相似,可以把它们组成一簇,然后在每一簇中执行近似连接.而不在任何簇中的文档,则无需对其进行任何计算.实验结果表明,提出的方法在保证正确率的前提下具有高效性. 相似文献
3.
聚簇索引在数据库查询中的重要作用 总被引:2,自引:0,他引:2
本文从数据库查询优化角度,把数据库查3种常规操作细分,进而概括出几乎所有的查询算法都是这些操作的不同组合。然后列举出4种常见的连接查询方法,利用细分的操作为4种查询方法建立模型,量化和分析它们的一些关键参数,从而说明逻辑邻接项的物理聚簇索引会对数据库查询性能产生很大影响。索引对查询性能提高程度的关键取决于是否建立的是聚簇索引。 相似文献
4.
XML数据库存储策略综述 总被引:9,自引:0,他引:9
XML是SGML一个子集,本质上是一种特殊的SGML标记语言.XML已经成为Internet上数据表示和数据交换的新标准,被认为是最有前途的一种半结构化数据组织方式.XML的重点是管理信息的数据本身,而不是数据的样式.XML这种明确的分工导致的将是更高效的Web程序设计,更快的搜索引擎、更统一的数据表示和更方便的数据交流的出现.因为底层的存储表达对上层的查询处理和优化有着重要的性能影响,所以如何存储XML文档才是最好的方式已经成为一个重要问题.本文介绍了几种XML数据库的存储策略,并对每种存储策略进行了描述、分析,然后对几种存储策略进行了性能和优缺点的比较. 相似文献
5.
随着XML技术的不断应用和推广,XML结构聚类技术在XML管理与挖掘中扮演着重要角色.针对目前XML结构聚类算法聚类不准确、效率低、对数据输入次序敏感的不足,提出簇核心的概念,并指出在动态环境下,对簇核心加以正确维护可以支持增量式聚类,在此基础上设计了一套有效的XML结构聚类算法COXClustering,该算法涵盖静... 相似文献
6.
Native XML数据库技术综述 总被引:12,自引:0,他引:12
XML成为数据统一描述和表示的标准。如何管理已经出现的大量的XML数据成为重要的问题。Native XML数据库(NXD)是解决XML数据管理的重要手段。分析和综述了NXD研究现状.以及几个主要研完方向:数据模型、查询语言、存储技术等。分析了NXD的基本特性和具有代表性的NXD系统,最后指出了目前研究存在的不足以及该学科的发展趋势。 相似文献
7.
8.
时空一体化的海量数据管理及相应的时序分析能力是新一代GIS软件体系的重要研究目标之一。当前,基于无缝海量大表的空间及时态空间数据的存取效率亟待提高。为了对海量时空数据进行有效管理和提高时空检索效率,以扩充关系型时空模型为基础,对大型对象一关系型数据库平台所提供的数据分区与聚簇方法进行了时空维的扩展,提出了基于时空分区聚簇(spatio-temporal partition clustering,STPC)的海量时空数据性能优化方法。基于2GB~60GB的单表所进行的检索效率对比测试结果表明,STPC机制较普通的数据组织方式时空检索效率平均提高了10.1%。 相似文献
9.
XML数据库的并行RPE查询 总被引:1,自引:0,他引:1
1.引言随着Internet应用的不断发展和日益普及,Internet上信息的定义和表示成为了重要的技术标准。目前,HTML标记语言由于其简单、易用等特点,已经成为广泛采用的一种标记语言。但是随着Internet上的信息量迅速地增长,在浩如烟海的信息中检索需要的内容变得越来越困难。HTML只是简单标记文档的展示格式,而不能把文档中的语义结构有效地表示出来,因而诸如Yahoo,Google等搜索引擎只能用关键字 相似文献
10.
多媒体数据的聚簇开采 总被引:3,自引:0,他引:3
Internet的普及使多媒体信息的信息量急剧增大,因而,多媒体数据开采逐渐引起人们的关注。文章基于多媒体数据的特点,结合多媒体信息检索技术和数据开采方法,提出了多媒体数据开采系统的基本框架,并给出多媒体数据上的一种聚簇开采算法MDC。 相似文献
11.
12.
Native XML数据库快速查询的实现,可以采用基于XML文档编码的结构连接算法。而结构连接算法的实现需要对XML文档进行编码,以便于快速判断XML文档树结点之间的祖先后裔关系。在对现有编码机制进行综述的前提下,提出一种新的XML文档编码机制——前缀整除编码(PDIV)机制。该机制编码形式简单,只需要一个正整数即可充分表示结点在XML文档树中的位置信息;可以实现祖先后裔关系的快速查询;支持XML文档的更新操作;编码长度较短,编码长度约为o(ln(n))。 相似文献
13.
Native XML数据库关键技术综述 总被引:1,自引:0,他引:1
Native XML数据库是一种根据XML数据的特点专门设计的用于存储和管理XML数据的新型数据库.在介绍Native XML数据库系统的特征和体系结构的基础上,对其存储机制、索引和查询技术、事务管理等关键技术进行了深入细致的研究和讨论,最后针对具体的Native XML数据库系统在这些方面的实现机制作了相应的对照和分析. 相似文献
14.
15.
Oracle数据库的XML存储技术研究 总被引:8,自引:0,他引:8
XML近来已成为Web上数据表示与交换的标准,而由此带来的一个亟需解决的问题就是XML数据在关系数据库中如何存储与管理。以Oracle数据库为例,分析和研究了Oracle的XML数据存储技术XSU和XSQL,XSU借助于一组Java类来实现Oracle数据库的XML数据的存储与生成,而XSQL通过使用XSQL页面模板和动作元素来实现。最后,以网上图书馆的人员数据库为例说明了该技术的应用。 相似文献
16.
基于XML的数据库存储访问技术 总被引:5,自引:3,他引:2
随着XML日益普遍应用,如何有效地存储和访问XML文档中的数据已成为亟待解决的关键问题。讨论了目前比较先进的XML技术和基于XML的数据库模型,依据该模型和微软的SQL Server 2000实现XML数据的存储和访问。举例说明了如何在SQL Server中实现XML访问和XML存储。 相似文献
17.
18.
基于JDBC和XML的数据库系统迁移方法 总被引:3,自引:0,他引:3
在分析了相关的数据库应用系统迁移方法的基础上,提出了一个基于JDBC和XML的数据库迁移方法,系统阐述了数据库应用系统从一个数据库系统(DBMS)向另一个数据库系统迁移中数据结构和对象的迁移方案.采用了类JDBC思想,设计了从Oracle系统到MYSQL系统不同SQL之间的自动转换工具,并以一个具体的网关计费系统为例,实现了从Oracle到MYSQL的数据迁移,为同类系统的迁移提供了有益的参考. 相似文献
19.
针对native XML数据库的更新操作,提出了一种增量式验证方法,确保更新后的XML数据仍然符合指定模式的约束.基于正则树文法理论,形式化地描述XML模式语言,给出DTD在native XML数据库中的表示与存储格式.在更新操作过程中,首先检验期望结果是否满足模式的约束;只有在更新操作通过验证的前提下,原始XML数据才允许被修改.由于增量式验证仅涉及到直接受更新操作影响的XML数据片段.因此,与完全重新验证相比,增量式验证可以极大地提高XML数据更新效率. 相似文献
20.
Eric Pardede J. Wenny Rahayu David Taniar 《Journal of Computer and System Sciences》2008,74(2):170-195
With the increasing demand for a proper and efficient XML data storage, XML-Enabled Database (XEnDB) has emerged as one of the popular solutions. It claims to combine the pros and limit the cons of the traditional Database Management Systems (DBMS) and Native XML Database (NXD). In this paper, we focus on XML data update management in XEnDB. Our aim is to preserve the conceptual semantic constraints and to avoid inconsistencies in XML data during update operations. In this current era when XML data interchange mostly occurs in a commercial setting, it is highly critical that data exchanged be correct at all times, and hence data integrity in XML data is paramount. To achieve our goal, we firstly classify different constraints in XML documents. Secondly, we transform these constraints into XML Schema with embedded SQL annotations. Thirdly, we propose a generic update methodology that utilizes the proposed schema. We then implement the method in one of the current XEnDB products. Since XEnDB has a Relational Model as the underlying data model, our update method uses the SQL/XML as a standard language. Finally, we also analyze the processing performance. 相似文献