共查询到20条相似文献,搜索用时 312 毫秒
1.
对XML数据索引的回顾 总被引:3,自引:1,他引:3
随着Internet的迅速发展,XML已成为Internet同上数据表示与交换的事实标准.大量应用采纳了XML.例如Web Service中的数据表示和交换、MPEG7中定义的多媒体特征描述子等。目前.查询XML数据需要用XPath.由于查询语句的复杂性.很难找到一种通用的索引结构能有效支持任意查询。因此,在近十年的研究历程中.为了实现XML数据的快速查询,人们提出了大量索引结构。本文就是对已经提出的一些代表性的索引结构进行分类和总结.并指出其优缺点和所能支持的查询。 相似文献
2.
3.
XML(extensible markup language)文档已经被广泛用作应用程序的一个数据交换格式,针对XML数据的压缩技术也逐渐成为新的研究领域。提出XSLC(XMLstream layered-coding compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元素的父子关系进行子元素层面的编码;同时根据数据类型进行数据压缩,能够在压缩之后的文档上进行查询,因为仅需一遍压缩扫描所以可以应用于数据流环境。实验表明:XSLC算法的压缩比率和压缩时间均优于传统算法。 相似文献
4.
XML数据中的不正确数据、不一致数据、不精确数据等劣质数据给XML数据上的有效查询处理带来了挑战。重点研究了标签劣质的XML数据上twig查询的处理方法。给出求得每个标签的拼写相近标签、松弛标签、同义标签等相似标签的方法,以及在XML文档中求出与原查询相似的所有查询结果的高效算法。通过实验证明了所提方法的有效性和效率。 相似文献
5.
6.
XML数据库查询及优化研究 总被引:2,自引:0,他引:2
随着网络信息的大量涌现和广泛应用,原来简单的信息发布技术已经不能满足必需的信息交流与共享,XML(eX tensibleMarkupLanguage)的出现似乎为上述问题的解决提供了转化。随着XML技术的不断成熟,要构建基于XML的各种应用,从XML数据源中准确有效地查询所需信息,也就变得越来越重要。文中对XML数据库查询语言及对半结构化数据查询、转换输出、数据集成、XML数据索引、结构模糊查询展开分析,详细探讨了XML查询语言的特点、模式、处理过程和查询优化等技术。 相似文献
7.
郑刚 《计算机技术与发展》2004,14(10)
随着网络信息的大量涌现和广泛应用,原来简单的信息发布技术已经不能满足必需的信息交流与共享,XML(eXtensible Markup Language)的出现似乎为上述问题的解决提供了转化.随着XML技术的不断成熟,要构建基于XML的各种应用,从XML数据源中准确有效地查询所需信息,也就变得越来越重要.文中对XML数据库查询语言及对半结构化数据查询、转换输出、数据集成、XML数据索引、结构模糊查询展开分析,详细探讨了XML查询语言的特点、模式、处理过程和查询优化等技术. 相似文献
8.
高效的索引是提高XML数据查询效率的关键,目前已经提出了许多XML索引算法,它们大多数都不支持XML数据更新。对CSSU编码进行了改进,提出了一种新的有效支持数据更新的路径索引算法,该索引算法有效支持单支查询和多支查询。 相似文献
9.
快速有效的XML访问控制新方案 总被引:3,自引:0,他引:3
随着可扩展标记语言(XML)文档的广泛使用和用户安全意识的加强,XML数据的安全问题显得日益重要。结合索引/标记方案,设计了一种安全的、能有效查询和快速更新的XML访问控制新方案。该方案利用多种授权实现了权限不同的多个用户灵活、安全地查询XML文档数据;利用空对象和备注子节点实现了XML数据的删除和插入。 相似文献
10.
11.
12.
XML模式中隐式冗余不存在的充要条件 总被引:1,自引:0,他引:1
吴永辉 《计算机研究与发展》2007,44(12):2106-2111
XML数据库模式规范化设计是产生一组相关联的、能表示数据间依赖关系、而且消除了冗余的XML模式或DTD,以更好地进行信息检索.XML数据库模式中某些数据依赖的存在是冗余存在的原因,因此在XML数据库模式中数据依赖与冗余的关联是其规范化设计研究的关键问题,但对这一问题目前还没有专门的研究.XML数据库模式的数据依赖包括属性间数据依赖和元素间的数据依赖,给出综合了属性间和元素间数据依赖的XML数据库模式数据依赖的定义,分析与之关联的隐式冗余,并论证XML模式中隐式冗余不存在当且仅当该XML模式是规范的,为XML数据库模式规范化设计更深一层的研究奠定理论基础. 相似文献
13.
XML数据的查询技术 总被引:31,自引:1,他引:31
XML规范已成为当前网络应用(包括数字图书馆、Web服务以及电子商务)中事实上的数据表达、交换的标准.针对XML数据的查询在当前XML数据管理研究中占有重要的地位,也是当前XML数据处理研究领域的热点方向,相关的研究文献有很多.根据查询模式描述的不同,将当前XML查询技术归入两大类:XML Query方式和XML IR方式.后者又进而可分以为3个子类:XML IR/keyword方式、XML IR/fragment和XML IR/query方式,并从中挑选出3个研究者关注的问题进行了简述,它们是:Twig查询模式的处理、SLCA(smallest lowest common ancestor)节点的获取以及对所获取的XML片段相似性的度量.以方便普通用户使用为准则探讨了相关XML查询技术的优、缺点,将如下4个问题作为需要进一步关注的研究内容:结构化关键字查询及相应的结构相似性度量方法,如何消除XML Query查询处理模式(包含XML IR/query)和XML IR/keyword查询处理模式间数据冗余的问题,XML Query查询方式的理论探讨及其实现以及针对特定应用的XML数据的有效管理. 相似文献
14.
15.
16.
面向XPath执行的XML数据流压缩方法 总被引:13,自引:0,他引:13
由于XML(extensible markup language)本身是自描述的,所以XML数据流中存在大量冗余的结构信息.如何压缩XML数据流,使得在减少网络传输代价的同时有效支持压缩数据流上的查询处理,成为一个新的研究领域.目前已有的XML数据压缩技术,都需要扫描数据多遍,或者不支持数据流之上的实时查询处理.提出了一种XML数据流的压缩技术XSC(XML stream compression),实时完成XML数据流的压缩和解压缩,XSC动态构建XML元素事件序列字典并输出相关索引,能够根据XML数据流所遵从的DTD,产生XML元素事件序列图,在压缩扫描之前,产生更加合理的结构序列编码.压缩的XML数据流能够直接解压缩用于XPath的执行.实验表明,在XML数据流环境中,XSC在数据压缩率和压缩时间上要优于传统算法.同时,在压缩数据之上查询的执行代价是可以接受的. 相似文献
17.
基于模式的XML文档在关系数据库中存储的设计 总被引:2,自引:0,他引:2
随着XML逐渐成为因特网上数据表示和数据交换的新标准,基于XML的数据交换数量呈现出指数增长的趋势。为了解决XML数据的存储问题,详细分析了XML模式,提出一个中间文法XSchema,建立中间数据模型XSModel来实现XML模式到关系模式的映射,并把这个映射从XML DTD推广到XML Schema。 相似文献
18.
Cong Yu H. V. Jagadish 《The VLDB Journal The International Journal on Very Large Data Bases》2008,17(2):203-223
As XML becomes increasingly popular, XML schema design has become an increasingly important issue. One of the central objectives
of good schema design is to avoid data redundancies: redundantly stored information can lead not just only to a higher data
storage cost but also to increased costs for data transfer and data manipulation. Furthermore, such data redundancies can
lead to potential update anomalies, rendering the database inconsistent. One strategy to avoid data redundancies is to design
redundancy-free schema from the start on the basis of known functional dependencies. We observe that XML databases are often
“casually designed” and XML FDs may not be determined in advance. Under such circumstances, discovering XML data redundancies
from the data itself becomes necessary and is an integral part of the schema refinement (or re-design) process. We present
the design and implementation of the first system, DiscoverXFD, for efficient discovery of XML data redundancies. It employs a novel XML data structure and introduces a new class of partition-based
algorithms. The XML data redundancies are defined on the basis of a new notion of XML functional dependency (XML FD) that
(1) extends previous notions by incorporating set elements into the XML FD specification, and (2) maintains tuple-based semantics
through the novel concept of Generalized Tree Tuple (GTT). Using this comprehensive XML FD notion, we introduce a new normal form (GTT-XNF) for XML documents, and provide comprehensive
comparisons with previous studies. Given the set of data redundancies (in the form of redundancy-indicating XML FDs) discovered
by DiscoverXFD, we describe a normalization algorithm for converting any original XML schema into one in GTT-XNF. 相似文献
19.
《Journal of Computer and System Sciences》2007,73(3):316-361
We present a technique for refining the design of relational storage for XML data. The technique is based on XML key propagation: given a set of keys on XML data and a mapping (transformation) from the XML data to relations, what functional dependencies must hold on the relations produced by the mapping? With the functional dependencies one can then convert the relational design into, e.g. 3NF, BCNF, and thus develop efficient relational storage for XML data. We provide several algorithms for computing XML key propagation. One algorithm is to check whether a functional dependency is propagated from a set of XML keys via a predefined mapping; this allows one to determine whether or not the relational design is in a normal form. The others are to compute a minimum cover for all functional dependencies that are propagated from a set of XML keys and hold on a universal relation; these provide guidance for how to design a relational schema for storing XML data. These algorithms show that XML key propagation and its associated minimum cover can be computed in polynomial time. Our experimental results verify that these algorithms are efficient in practice. We also investigate the complexity of propagating other XML constraints to relations. The ability to compute XML key propagation is a first step toward establishing a connection between XML data and its relational representation at the semantic level. 相似文献