首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 216 毫秒
1.
XML数据库模式规范化设计是产生一组相关联的、能很好地表示数据间依赖关系、而且消除了冗余的XML模式或DTD,以更好地进行信息检索.XML数据库模式中某些数据依赖是冗余存在的原因.因此在XML数据库模式中数据依赖与冗余的性质以及关联是其规范化设计要解决的关键问题.XML数据库模式的数据依赖包括属性间数据依赖和元素间的数据依赖.在以往的工作中,已经给出XML数据库模式中元素间的数据依赖及其所关联的显式冗余的有关性质,并基于此实现和验证相应的XML数据库模式规范化设计算法.分析XML数据库模式中属性间的数据依赖、元素间的数据依赖及其关联,定义XML数据库模式数据依赖及其相关联的隐式冗余,并论证XML数据库模式中隐式冗余不存在的充分条件.  相似文献   

2.
XML数据库模式规范化设计是产生一组相关联的、能表示数据间依赖关系、而且消除了冗余的XML模式或DTD,其目的是为了互联网上的信息检索能够避免异常. XML数据库模式中某些数据依赖的存在是冗余存在的原因,因此在XML数据库模式中数据依赖与冗余的关联是其规范化设计研究的关键问题. XML数据库模式的数据依赖包括属性间数据依赖和元素间的数据依赖,与之关联的结构冗余和不规则是指在XML模式的结构上存在冗余和不规则的情况.给出综合了属性间和元素间数据依赖的XML数据库模式数据依赖的定义,分析与之关联的结构冗余以及不规则的情况,基于此定义消除结构冗余和不规则的规范的XML模式森林作为范式,给出并验证其规范化设计算法.  相似文献   

3.
消除结构冗余的XML数据库模式规范化设计   总被引:5,自引:2,他引:5  
XML数据库模式规范化设计是给出一个能很好地表示数据间依赖关系并消除了冗余的XML模式或DTD的集合.目前这一领域的研究并没有对XML数据库模式中的数据依赖和冗余进行专门的分析.引人标识符分别表示XML模式中的元素和属性,分析XML数据库模式的结构冗余:局部冗余、传递冗余和不规则;并在此基础上,定义XML数据库模式第3范式(3NF),给出并验证其规范化设计算法.  相似文献   

4.
随着XML应用越来越广泛,为避免冗余,XML模式设计也变成了越来越受关注的问题,因此XML规范化理论是一个重要的研究领域.类似于关系数据库,本文从数据库角度出发,以消除数据冗余为目的,研究DTD中以路径表达式为基础的基本定义;因函数依赖和多值依赖是数据语义的重要组成部分,将其引入到XML领域中,形式化定义了XML的函数依赖和多值依赖;基于XML树、函数依赖和多值依赖概念,给出了键、冗余的描述,进而在XML函数依赖和多值依赖并存情况下,提出了满足XML第四范式的条件;给出了满足XML第四范式条件的XML文档树无冗余的判定定理,并通过具体实例及实验证明了XML第四范式的有效性.  相似文献   

5.
现代社会,是经济迅速发展的社会,而随着经济基础的迅速发展,信息技术也快速的发展和广泛的应用,计算机技术正向着微型化和专业还的趋势发展着。而数据库技术的利用也是计算机应用技术中比较常用的一种,数据库技术中比较常用的有XML、SQL等等。该文基于XML数据库模式中数据依赖和机构冗余方面做了简单阐述。  相似文献   

6.
为了消除数据冗余,基于关系数据模型的函数依赖理论已经被广泛接受并应用于关系数据库的设计中。XML数据库中同样存在数据冗余。为了设计没有冗余的XML数据库,需要用一种简洁、易于理解的方法来定义XML数据问依赖关系。在无序的结点标记树数据模型上定义了XML子树间的函数依赖,并且给出了一套公理系统用来推导函数依赖,以解决函数依赖的蕴涵问题,最后证明了该公理系统是合理的。  相似文献   

7.
从消除XML文档内数据冗余的角度出发研究了文档的规范化问题.首先引入XML上的数据冗余及其消除处理示例,同时基于函数依赖,提出了规范化的DTD概念和XML DTD 规范化处理规则;其次通过XML多值依赖的定义,给出用于消除冗余模式的算法;最后给出用于XML模式及其消除冗余模式的算法.该算法相应于其他XML模式的研究,在算法产生的层次模式中,完全MVD和嵌入MVD的集合由给出的MVD集合导出;并且产生的XML模式具有消除冗余模式和满足无损连接的特性.  相似文献   

8.
用于XML模式和DTD规范化设计的层次模式设计   总被引:15,自引:0,他引:15       下载免费PDF全文
吴永辉 《软件学报》2004,15(7):1099-1106
XML模式和DTD(document type definition)规范化设计是给出一个很好地表示数据间依赖关系并消除了冗余的XML模式或DTD的集合.目前在这一方面开展的研究还不多,而且才刚起步.Provost提出将关系数据库理论应用于XML模式规范化设计的思想,这一思想还没有付诸实施.在Provost思想的基础上给出用于XML模式和DTD规范化设计的层次模式设计的算法.首先分析了基于Provost思想的层次分解;然后给出用于消除冗余模式的分解树设计算法;最后给出用于XML模式和DTD规范化设计的层次  相似文献   

9.
给出了XML间接函数依赖和传递函数依赖的概念,据此提出了以DTD为模式的XML文档的一种范式XMLNF,它可以消除XML文档中由于间接函数依赖和传递函数依赖所引起的数据冗余,给出了把DTD无损联接地分解成XMLNF的规范化方法.  相似文献   

10.
沈刚  罗军 《计算机工程》2009,35(12):56-58
XML保持语义下的冗余检测问题对于防止XML文档的更新异常和减少XML冗余信息的存储具有很大意义,是XML规范化理论的关键问题之一。对XML schema、树元组、XML键、XML范式等进行研究,定义基于schema的XML函数依赖形式化模型,并基于该定义模型设计一种新的XAP算法,可有效发现XML文档中的函数依赖和冗余,并对算法的复杂性进行分析。  相似文献   

11.
As XML becomes increasingly popular, XML schema design has become an increasingly important issue. One of the central objectives of good schema design is to avoid data redundancies: redundantly stored information can lead not just only to a higher data storage cost but also to increased costs for data transfer and data manipulation. Furthermore, such data redundancies can lead to potential update anomalies, rendering the database inconsistent. One strategy to avoid data redundancies is to design redundancy-free schema from the start on the basis of known functional dependencies. We observe that XML databases are often “casually designed” and XML FDs may not be determined in advance. Under such circumstances, discovering XML data redundancies from the data itself becomes necessary and is an integral part of the schema refinement (or re-design) process. We present the design and implementation of the first system, DiscoverXFD, for efficient discovery of XML data redundancies. It employs a novel XML data structure and introduces a new class of partition-based algorithms. The XML data redundancies are defined on the basis of a new notion of XML functional dependency (XML FD) that (1) extends previous notions by incorporating set elements into the XML FD specification, and (2) maintains tuple-based semantics through the novel concept of Generalized Tree Tuple (GTT). Using this comprehensive XML FD notion, we introduce a new normal form (GTT-XNF) for XML documents, and provide comprehensive comparisons with previous studies. Given the set of data redundancies (in the form of redundancy-indicating XML FDs) discovered by DiscoverXFD, we describe a normalization algorithm for converting any original XML schema into one in GTT-XNF.  相似文献   

12.
不完全信息环境下存在XML强多值依赖的XML文档规范化研究   总被引:3,自引:0,他引:3  
不完全信息环境下XML文档中的数据存在多值依赖时.为了避免在没有约束条件下XML文档数据出现冗余及更新异常,引入XML强多值依赖的概念和理论对XML文档的规范化进行了系统研究.基于节点信息等价、节点信息相容的概念给出了XML强多值依赖的定义;基于层次化的XML强多值依赖,提出了不完全XML文档树满足XML强多值依赖范式的条件;给出了满足该条件的不完全XML文档树无数据冗余的判定定理;提出了不完全XML文档树的规范化算法,对其时间复杂性进行了分析.理论研究和实例分析表明:研究成果较好地解决了在不完全信息环境下XML文档中存在层次化的XML强多值依赖引起的数据冗余问题.  相似文献   

13.
XML DTD的一种范式   总被引:5,自引:0,他引:5  
研究了XML DTD的规范化问题。由于DTD在设计上存在不足之处,DTD中可能包含类似于关系数据库模式中存在的异常依赖,从而导致XML文档包含冗余的数据和各种操作异常。提出了关于DTD的多值依赖的概念,然后基于多值依赖的概念,提出了一种XML的范式XNF,并且用DTD的关系表示形式给出了关于DTD的无损联接分解的概念。最后给出了把DTD无损联接地分解成XNF的一种算法。  相似文献   

14.
XML has become the standard for publishing and exchanging data on the Web. However, most business data is managed and will remain to be managed by relational database management systems. As such, there is an increasing need to efficiently and accurately publish relational data as XML documents for Internet-based applications. One way to publish relational data is to provide virtual XML documents for relational data via an XML schema which is transformed from the underlying relational database schema such that users can access the relational database through the XML schema. In this paper, we discuss issues in transforming a relational database schema into the corresponding XML schema. We aim to preserve all integrity constraints defined in a relational database schema, to achieve high level of nesting and to avoid introducing data redundancy in the transformed XML schema. In the paper, we first propose a basic transformation algorithm which introduces no data redundancy, then we improve the algorithm by exploring further nesting of the transformed XML schema.  相似文献   

15.
16.
基于约束的XML文档规范化算法   总被引:8,自引:0,他引:8  
XML模式设计是XML数据库设计的关键.基于XML文档的基本概念给出了XML部分函数依赖、传递函数依赖、XML范式、XML第1到第3范式以及DTD无损联接分解的相关定义,提出XML模式规范化转换规则,给出无损联接分解的两种规范化算法,对算法的正确性、可终止性和时间复杂性进行了证明分析,并实验证明了规范化后的文档查询和存储效率有明显的提高.这将对未来的XML函数依赖保持、XML多值依赖以及XML模式设计的进一步规范化研究奠定理论基础.  相似文献   

17.
存在多值依赖的XML DTD规范化研究   总被引:1,自引:0,他引:1  
丘威  张立臣 《计算机科学》2007,34(2):149-151
XML DTD文档中可能包含由非函数依赖引起的数据冗余和操作异常,首先从消除DTD文档内数据冗余的角度出发研究了文档的规范化的问题,讨论了在DTD文档中存在多值依赖的情况下,如何规范XML文档,提出了以DTD为模式的XML文档的多值依赖的概念。然后基于多值依赖的概念,提出了XML文档的一种多值依赖范式MXNF。最后在此基础上提出了把一个XML文档的DTD无损联接地分解成为符合MXNF的规范化算法,来规范存在多值依赖的XML DTD文档,并给出了该算法的分析说明。  相似文献   

18.
基于演化计算的XML数据的关系存储   总被引:5,自引:0,他引:5  
随着XML规范的制定和推广,XML数据管理技术受到数据库界广泛重视,XML数据的存储是XML数据管理的关键.研究了利用数据库技术和人工智能技术,为XML数据的关系存储提供一种灵活的策略.首次提出了代价驱动的基于遗传算法的关系存储策略CDGABRS,针对不同的用户和查询模型,产生不同的映射模型方案,引进遗传算法,计算对应的系统开销,从中求出使系统的存储代价和查询代价最优的关系存储方案.实验证明了CDGABRS方法的可行性和高效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号