首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
目前的XML文档映射关系数据库方法普遍存在生成的数据表较多、查询效率较低等问题,基于模型映射提出一种包含Dewey编码的XML文档映射关系数据库方法。给出了映射的逻辑结构模型、详细设计方案、映射算法和实验结果。实验结果表明,该方法生成的数据表结构简单,与传统算法相比在文档解析和数据查询方面具有一定的性能优势。  相似文献   

2.
随着XML技术的发展,如何利用现有的数据库技术存储和查询XML文档已成为XML数据管理领域研究的热点问题。本文介绍了一种新的文档编码方法,以及基于这种编码方式提出了一种新的XML文档存储方法。方法按照文档中结点类型将XML文档树型结构分解为结点,分别存储到对应的关系表中,这种方法能够将任意结构的文档存储到一个固定的关系模式中。同时为了便于实现数据的查询,将文档中出现的简单路径模式也存储为一个表。这种新的文档存储方法能够有效地支持文档的查询操作,并能根据结点的编码信息实现原XML文档的正确恢复。最后,对本文提出的存储方法和恢复算法进行了实验验证。  相似文献   

3.
XML在关系数据库中的存储问题是XML研究领域中的一个重要问题。在总结多种映射方法的基础上,提出了一种方法将多个相似的XML文档进行解析,根据映射关系,生成各自的关系模式,并分析归纳出一个集成的关系模式,然后创建一个关系数据库,并在映射关系的基础上提取并存储XML文档数据到关系数据库。此方法以较为简洁的结构保存了XML文档的数据信息,其最大的特点就是不用考虑文档的模式信息(DTD,XML Schema)。并通过一个具体的实验结果来说明这种方法的有效性。  相似文献   

4.
XML数据在关系数据库中的存储   总被引:3,自引:1,他引:3  
余贞斌  王新伟 《微机发展》2005,15(11):120-122
Internet的高速发展和人们对数据标准性、平台无关性的要求的日益提高使得XML得到了广泛的应用,同时也对XML数据的存储方式提出了更高要求。文中首先对目前已提出的XML文档在关系数据库中存储的解决方法进行了评述,然后介绍了XML与关系数据库在组织数据的方式上的异同及把XML文档映射为关系数据的难点,在此基础上提出了一种基于XML Schema将XML文档映射为关系数据模式的方法,并给出了一个映射的具体实例,实例验证了文中提出的这种映射方法确能比较完善地完成映射任务。  相似文献   

5.
Internet的高速发展和人们对数据标准性、平台无关性的要求的日益提高使得XML得到了广泛的应用,同时也对XML数据的存储方式提出了更高要求.文中首先对目前已提出的XML文档在关系数据库中存储的解决方法进行了评述,然后介绍了XML与关系数据库在组织数据的方式上的异同及把XML文档映射为关系数据的难点,在此基础上提出了一种基于XML Schema将XML文档映射为关系数据模式的方法,并给出了一个映射的具体实例,实例验证了文中提出的这种映射方法确能比较完善地完成映射任务.  相似文献   

6.
随着XML技术研究与应用的深入,涌现出了大量XML文档.为了对XML文档进行管理和查询,大多数RDBMS扩充了处理XML数据的功能.这种方式将XML数据映射到关系表中,会破坏XML数据的树型结构.查询时,需要多次的表连接,降低了查询效率.原生XML数据库以XML文档作为基本的逻辑存储单位,建立底层的物理存储模型.提出了一种原生XML数据库的后端实现策略--XBackend,包括存储策略、索引策略、数据库恢复策略. XBackend底层存储是专门为XML数据设计的,配合适当的索引,具有更高的存储和查询效率.数据库恢复策略保证了原生XML数据库数据的一致性状态.实验结果表明XBackend具有很好的性能.  相似文献   

7.
XN-Store:一种原生XML数据库的存储方案   总被引:1,自引:0,他引:1  
随着XML相关标准的推广与应用,Web上出现了大量的XML文档,为了进行有效的管理,有必要将XML文档存储到数据库中,存储方案已成为XML数据管理领域研究的一个重要课题,将XML文档映射为关系表,存储到传统的RDBMS中,会破坏XML数据的树形结构,造成查询效率的下降,提出了一种新的用于原生XML数据库的存储方案--XN-Store,该方案基于索引结构将XML节点作为记录直接存储到分页文件中,建立起持久化文档对象模型,从而保持了XML数据原有的树形结构.XN-Store不仅降低了XML文档的存储空间开销,而且实现了XML节点的快速串行化输出和访问操作.作为通用的原生XML存储方案,XN-Store支持各种二级索引的创建,以提高XML查询处理的效率,采用多种数据集,分别在XN-Store和先前的XML存储系统上进行实验,比较存储空间、存储时间、串行化时间和节点访问时间.实验结果表明,XN-Store是一种高性能的原生XML数据库存储方案.  相似文献   

8.
周全  李旸 《计算机技术与发展》2010,20(9):243-245,249
关系数据库是当今农业信息存储的主要形式。随着Web技术的发展,信息检索越来越复杂,关系数据库需要更好被Web理解,需要更多语义上下文支持;使用XML格式文档来表达和存储数据的目的就是要解决这方面问题。文中以常见农业动物疾病信息数据库为例,通过比较两种数据存储表示形式找出XML文档结构的优势并使用Java语言设计映射算法,把现有禽类疾病关系数据库部分内容映射为XML数据形式,证明了该存储方式的优越性,为今后农业动植物疾病的语义网建设打下基础。  相似文献   

9.
XML已成为各种网络应用中数据存储和数据交换的标准.XML数据管理面临的最大困难在于结构与数据混合存储导致大量数据冗余,这极大地增加了XML数据存储、交换和处理的代价.对XML文档进行压缩可以在一定程度上解决这个问题.但现有XML压缩方法大都仅压缩单文档中的冗余信息.利用XML文档间的相似性,提出一种支持查询的多XML文档压缩存储方法XCluster.XCluster先利用XML有根有序标签树上改进的pq-gram近似距离对XML文档集进行层次聚类;然后合并每个聚类结果子集中文档的结构得到结构代表并进行字典编码压缩;同时合并不同文档内同一标签下的值内容,并根据其数据类型进行相应编码压缩.实验结果表明,在真实和生成的XML多文档数据集上,XCluster比XGrind和XQilla具有更好的压缩效果和查询效率.  相似文献   

10.
一种基于模型映射的XML文档存储模型   总被引:1,自引:0,他引:1       下载免费PDF全文
本文提出了一种基于模型映射的XML文档存储模型Xpev,模型映射的主要特点是存储XML文档时不需要文档的模式信息。Xpev主要由三个表构成,通过Xpev可以将以数据为中心的XML文档存储到关系数据库中。Xpev模型优于已有的基于模型映射的存储模型。  相似文献   

11.
XML数据的结构化处理方法   总被引:16,自引:0,他引:16  
越来越多的数据采用XML格式表示和交换,对XML数据的有效访问方法是目前需要解决的关键问题之一.对通过面向对象数据库系统访问XML数据的方法进行了讨论,提出了将XML数据映射到对象模型的规则以及建立XML数据的OODB模式的方法.为了建立高效地访问路径提出了一种XML数据的结构索引,并介绍了利用结构索引实现基本的数据操作的方法.实验结果表明,提出的方法具有较高的效率。  相似文献   

12.
一种基于RDBMS的XML数据的存储方法   总被引:1,自引:0,他引:1  
XML作为一种数据交换的标准在互联网上推出,使得XML数据和数据库的相互交换成为必要:一是因为WEB中大量的多样化数据需要进行有效的存储和管理;二是因为在现有的数据库中存储有大量的数据并且需要将这些数据转换为XML发布到WEB中。论文提出了一个基于关系数据库的数据转换框架,基于数据的完整性讨论XML数据存储策略。建立一个XML通用数据模型,把文档树分解成多个节点,根据一定的映射规则存储到关系表中,从而不用考虑文档的模式信息(DTD、XMLSchema)。最后通过一个具体的文档实例来说明这种策略的有效性。  相似文献   

13.
首先介绍了异构交换网络拓扑结构中星形树结构相对于其他结构的优势,接着分析比较了基于模板驱动和基于模型驱动的XML与关系数据库映射方法,然后介绍了JMS技术实现XML文档传输的特点以及星形树网络中文档的路由算法。基于以上分析,最后采用扩展的基于模型驱动算法设计实现了一个电子政务数据交换原型系统。  相似文献   

14.
利用关系表构建XML文档解析的树模型   总被引:2,自引:1,他引:1  
祝青  阳王东 《计算机应用》2009,29(6):1719-1721
在对XML文档的数据解析和查询操作研究中,发现树能较好地反映XML文档的层次结构,但其查询效率较低,而关系表是一种适合存储大量数据且有较好查询效率与操作功能的数据结构。给出了一个把树和关系表相结合构建一种存储XML文档的数据模型;在这个模型的解析过程中,采用回调事件式的分段解析方法以减少解析时间和存储空间。这样既能较好保存XML文档的结构特点,又能提高其查询的效率和操作的便利性。通过对大数据量XML文档的解析和操作实验,实验结果证明这种数据模型在处理大型XML文档中具有明显优势。  相似文献   

15.
根据概率数据的描述形式对概率数据分为基于关系的概率数据模型和基于XML的概率数据模型两类。基于关系的概率数据模型是为每个元组引入概率标记属性表示不确定性,使元组的存储、查询处理变得复杂;基于XML的概率数据模型是在普通XML树中添加表示概率属性结点,能够表示多粒度的概率信息。设计了映射为关系的概率XML数据的与PDTD无关的PXRel和PXParent两种存储模式,并通过实验验证了其有效性。  相似文献   

16.
基于XML和N层VSM的Web信息检索   总被引:2,自引:0,他引:2  
基于XML文档格式良好、层次清晰,可以方便地操纵、分析其结构的特点。文中在将Web上的HTML文档转化为XML文档的基础上,通过Java中的DOM树,分析文档的层次结构。把文档分为层次化的文本段,对传统的VSM算法进行改进,把每个文本段转换为空间向量,实现了N层VSM算法,通过试验证明,改进后算法的查全率和查准率都要优于传统的VSM算法。  相似文献   

17.
基于DOM的空间数据转换模型的研究与设计   总被引:1,自引:0,他引:1  
正如XML正在对Web信息的组织与传输性能产生深远影响一样,作为基于XML的空间信息编码标准的GML语言,也正在地理领域掀起一场针对空间数据处理的革命。设计并实现空间数据转换模型,其目的在于摆脱异构空间数据不易实现共享与互操作的困境。转换模型首创性地提出了“超集式GML数据结构”这一新的术语。作为HTML与XML文档应用程序接口的DOM,将文档的逻辑结构组织成DOM树。Delphi7.0内置的TXMLDocument组件实现了DOM解析接口。论文最后对基于DOM技术的空间数据基础转换系统作了阐述。  相似文献   

18.
Excel报表数据的自动分离引擎   总被引:2,自引:0,他引:2       下载免费PDF全文
针对当前Excel报表数据自动采集的局限性,提出一种Excel报表数据自动分离的方法,并以此为基础进行引擎的研究。该引擎采用两级映射(模板样式到模板结构树和模板结构树到XML架构),根据Excel模板自动生成XML 架构和映射信息。借助Excel数据分离机制将Excel报表数据自动分离成与模板样式相对应的XML数据文件,使Excel报表的数据采集更加容易,更加有利于系统扩展与集成。  相似文献   

19.
基于频繁结构的XML文档聚类   总被引:1,自引:1,他引:0       下载免费PDF全文
研究基于频繁结构的XML文档聚类方法,其频繁结构包括频繁路径和频繁子树。首先介绍一种挖掘XML文档中所有嵌入频繁子树的算法SSTMiner,对SSTMiner算法进行修改,得到FrePathMiner算法和FreTreeMiner算法,分别用于挖掘XML文档中最大频繁路径和最大频繁子树,在此基础上,提出一种凝聚的层次聚类算法XMLCluster,分别以最大频繁路径和最大频繁子树作为XML文档的特征,对文档进行聚类。实验结果表明FrePathMiner算法和FreTreeMiner算法找到频繁结构的数量都比传统的ASPMiner算法多,这就可以为文档聚类提供更多的结构特征,从而获得更高的聚类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号