首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 140 毫秒
1.
面向XPath执行的XML数据流压缩方法   总被引:13,自引:0,他引:13       下载免费PDF全文
由于XML(extensible markup language)本身是自描述的,所以XML数据流中存在大量冗余的结构信息.如何压缩XML数据流,使得在减少网络传输代价的同时有效支持压缩数据流上的查询处理,成为一个新的研究领域.目前已有的XML数据压缩技术,都需要扫描数据多遍,或者不支持数据流之上的实时查询处理.提出了一种XML数据流的压缩技术XSC(XML stream compression),实时完成XML数据流的压缩和解压缩,XSC动态构建XML元素事件序列字典并输出相关索引,能够根据XML数据流所遵从的DTD,产生XML元素事件序列图,在压缩扫描之前,产生更加合理的结构序列编码.压缩的XML数据流能够直接解压缩用于XPath的执行.实验表明,在XML数据流环境中,XSC在数据压缩率和压缩时间上要优于传统算法.同时,在压缩数据之上查询的执行代价是可以接受的.  相似文献   

2.
可查询XML数据压缩技术概述   总被引:1,自引:0,他引:1       下载免费PDF全文
随着互联网技术的迅速发展,XML已经成为Web上信息表示和数据交换的事实标准。XML数据的冗余性影响了XML数据传输、查询处理等方面的效率,数据压缩是解决冗余的一种途径。介绍了典型的可查询XML压缩技术,阐述了各种压缩技术的优缺点,比较了各压缩技术的压缩率、压缩时间、支持查询的类型等;最后总结了可查询XML压缩技术的不足之处及其发展的趋势。  相似文献   

3.
针对支持查询的XML数据压缩方法存在的路径和数据重复等问题,通过去除XML数据中的重复路径,简化XML数据结构,提出结构标记树的概念及其生成算法,设计一种基于结构标记树的可查询XML数据压缩方法SSTQC,对XML数据进行压缩和组织查询。SSTQC一次扫描XML文档,具有较好的的压缩性能和查询效率。  相似文献   

4.
随着互联网技术的迅速发展,XML已经成为Web上信息表示和数据交换的事实标准。由于XML具有自我描述能力,使得XML文档显得冗长,以至于包含了大量的冗余信息,这样必将影响数据查询处理和交换的效率。因此,XML数据压缩技术对于减少资源的使用显得特别重要。概述了XML压缩研究的现状;分析了典型的XML压缩技术,对其性能进行了比较;总结XML压缩技术的不足及发展趋势。  相似文献   

5.
基于XML Enabled数据库技术的应用研究   总被引:3,自引:0,他引:3  
利用XML Enabled数据库DB2XML API技术可以实现传统数据库向XML数据的动态转换,并在此基础上对生成的XML文档进行查询和显示。这种方法在保留了现有数据的基础上,减少了数据库读取次数,又满足了XML应用的需求,可作为一种面向B2CXML应用的通用方法。  相似文献   

6.
基于Web的数据挖掘技术的应用研究   总被引:7,自引:0,他引:7  
Web是一个动态性极强的信息源,要访问、分析这些数据必须要研究异构数据的集成问题和选择合适的技术进行数据分析、集成和处理.文中介绍了多数据源数据仓库体系结构,多数据源数据的集成思想和实现的框架;分析了转换器在面向Web的数据挖掘中存在的不足和XML语言的技术特点;提出了应用XML技术对多数据源数据进行集成与转换以便构建数据仓库,同时给出了关键技术的实现方法.  相似文献   

7.
随着Web技术的快速发展,如何有效地存储、索引、查询和显示XML数据已经成为数据库研究领域的一个热点研究问题。本文介绍了XML数据的3种不同存储方法;XML搜索查询的工具和语言;XML数据的访问控制模型;XML最直接的显示方法以及正在实现的真正的XML数据库等。通过这些XML数据管理技术,可以了解到当下XML研究领域的先进技术和方法,指导今后的研究方向和重点。  相似文献   

8.
数据同步技术一直是影响分布式计算机系统应用的一个决定性因素,在简单介绍了现有的数据同步技术的基础上,提出了采用Windows的消息队列和二进制XML编码技术相结合的数据库同步方案,给出了具有较高数据压缩比率的二进制XML编码算法,实现了在窄带网络环境下的数据同步,并对数据同步的导入导出策略进行了设计,仿真测试的结果表明该同步算法相较于传统的数据同步算法具有很好的网络传输特性及数据同步的可靠性,这些对于数据同步技术的研究,在理论与实践上都有一定的借鉴意义。  相似文献   

9.
数据同步技术一直是影响分布式计算机系统应用的一个决定性因素,在简单介绍了现有的数据同步技术的基础上,提出了采用Windows的消息队列和二进制XML编码技术相结合的数据库同步方案,给出了具有较高数据压缩比率的二进制XML编码算法,实现了在窄带网络环境下的数据同步,并对数据同步的导入导出策略进行了设计,仿真测试的结果表明该同步算法相较于传统的数据同步算法具有很好的网络传输特性及数据同步的可靠性,这些对于数据同步技术的研究,在理论与实践上都有一定的借鉴意义。  相似文献   

10.
基于XML技术的中小型企业电子商务数据集成方案   总被引:2,自引:0,他引:2  
利用XML及相关标准和技术,结合电子商务安全技术和其他现有技术,构建了以SOAP为媒介的Web服务,从而提出了一个面向中小企业的经济的、兼容的、可扩展的、安全的电子商务数据集成方案,以解决中小企业电子商务数据集成中所存在的问题。  相似文献   

11.
XML(extensible markup language)文档已经被广泛用作应用程序的一个数据交换格式,针对XML数据的压缩技术也逐渐成为新的研究领域。提出XSLC(XMLstream layered-coding compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元素的父子关系进行子元素层面的编码;同时根据数据类型进行数据压缩,能够在压缩之后的文档上进行查询,因为仅需一遍压缩扫描所以可以应用于数据流环境。实验表明:XSLC算法的压缩比率和压缩时间均优于传统算法。  相似文献   

12.
张胜  舒坚  包晓玲 《计算机应用》2008,28(10):2537-2540
XML已经成为互联网上信息交换和信息表示的事实标准。然而XML文档中包含大量重复出现的标签和结构等冗余信息,导致XML文档在查询处理和数据交换时付出更高的代价,特别在带宽和资源受限的设备上显得更为突出。压缩技术是解决这一问题的重要途径。搜集了近几年提出的各种XML压缩方法,从压缩率、压缩与解压时间、内存消耗、查询性能等方面比较分析了六个具有代表性的XML压缩技术,最后简要归纳了各自的优点和存在的不足,并探讨未来努力的方向。  相似文献   

13.
XCfde:高压缩率的XML文档压缩技术   总被引:1,自引:0,他引:1       下载免费PDF全文
本文提出了一种用于数据交换的XML压缩技术XCfde。XCfde采取四步压缩方案:把XML文档分离为结构数据和内容数据;自动识别数据类型并自动分类数据;对不同类型的数据采用不同的编码策略;将初步编码后的结构数据和内容数据使用7Zip进行整体压缩。XCfde拥有较高的压缩率,改善了XML数据交换的传输效率和存档中的空间利用率。  相似文献   

14.
基于XML数据集成与交换中的完整性约束研究   总被引:1,自引:1,他引:0  
介绍了CoXML系统中提出的3种新的XML完整性约束技术:基于XML的数据交换中的函数依赖转换方法,面向XML Schema的键约束转换方法和基于XPath的XML文档键约束验证方法,并且通过CoXML系统的实现验证了这些技术的有效性.  相似文献   

15.
概率XML数据管理技术研究进展   总被引:2,自引:0,他引:2  
随着网络应用的快速发展,XML数据已大量存在于当前的信息社会,使得XML类型的数据成为当前主流的数据形式,并已经成为Internet中进行数据交换和表示事实上的标准.由于客观世界的复杂性,不确定性是数据常见的内在属性,因此不确定的信息是普遍存在的.通常不确定信息以概率值的形式在XML文件(称为概率XML文件)中表示,因此,研究表示和处理概率XML数据将成为一个新的研究领域.自2001年以来,概率XML数据管理技术取得了一系列研究成果.从概率XML数据模型、PXML代数、查询、原型系统等几个方面综述了概率XML数据管理的研究进展,讨论了目前存在的主要问题和需要进一步研究的方向.  相似文献   

16.
XML已成为各种网络应用中数据存储和数据交换的标准.XML数据管理面临的最大困难在于结构与数据混合存储导致大量数据冗余,这极大地增加了XML数据存储、交换和处理的代价.对XML文档进行压缩可以在一定程度上解决这个问题.但现有XML压缩方法大都仅压缩单文档中的冗余信息.利用XML文档间的相似性,提出一种支持查询的多XML文档压缩存储方法XCluster.XCluster先利用XML有根有序标签树上改进的pq-gram近似距离对XML文档集进行层次聚类;然后合并每个聚类结果子集中文档的结构得到结构代表并进行字典编码压缩;同时合并不同文档内同一标签下的值内容,并根据其数据类型进行相应编码压缩.实验结果表明,在真实和生成的XML多文档数据集上,XCluster比XGrind和XQilla具有更好的压缩效果和查询效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号