共查询到19条相似文献,搜索用时 78 毫秒
1.
针对当前常用的XML压缩算法没有考虑中文特点的情况,结合中文与XML的特点,提出一种高压缩率的适合中文XML文档的压缩算法COX。利用中文分词技术对XML文档进行分词处理,通过统计词频后获得排序的词典,利用Huffman编码思想对高频及长词汇进行压缩编码;解析XML文档后,把文档元素进行分类,同一类型的元素放入同一容器之中;算法还特别针对数字类型的数据进行了特殊处理。实验结果显示,相对于通用的压缩软件,COX具有更好的压缩效果,但压缩和解压缩时间要慢一些。 相似文献
2.
3.
近年来,XML已成为Web上信息交流和资源共享的主要载体。但XML自身的自冗余特性限制了它的普遍应用。目前,已经有研究成果提出了XML的压缩方法。压缩的XML文档能够有效利用存储空间,节省网络带宽。在实际应用中,经常需要对压缩存储的XML文档进行更新。对于大的压缩文档,如果先解压再更新,会消耗大量时间,因此,高效的更新方法应该避免解压缩文档,在压缩的XML文档上直接进行更新操作。本文针对压缩XML文档中的数值类型(包括整型和浮点型)数据,研究了在保持压缩状态条件下如何进行有效的数值更新,提出了基于XPRESS实现的Naive数值更新方法,以及修改XPRESS编码方法实现的更为高效的Pivot数值更新方法。通过大量的实验证明,Pivot数值更新方法不仅能够提供高效的更新处理,而且保持了XPRESS的高压缩率。 相似文献
4.
利用XML技术和多媒体数据库技术相结合建构多媒体课件文档库管理系统模型构架。 相似文献
5.
以XML文档发布关系数据 总被引:2,自引:0,他引:2
万常选 《计算机应用与软件》2002,19(8):30-33,50
本文对以XML文档发布关系数据的新技术进行了综述,主要分析了两种发布关系数据到XML文档的语言描述及其实现技术,以及它们的优缺点,一种是利用并扩展SQL的功能来描述这种转换,嵌套的SQL表达式被利用来描述嵌套,扩展的SQL标量及聚集函数被利用来描述XML元素构造,实现将关系数据转换为XML文档,另一种是利用RXL(Relational to XML Transformation Language)语言来定义一个关系数据库的XML视图,该XML视图是虚的,其它应用可再利用XML查询语言XML-QL在虚拟的视图上构造一个查询,抽取XML视图中的数据片断并对抽取的部分进行物化,实现将关系数据转换为XML文档。 相似文献
6.
XML的自描述特性使得XML数据中存在大量冗余信息。如何压缩XML数据以提高XML数据管理的效率成为一个新的研究领域。从2001年起,XML数据压缩技术的研究已经取得了很多研究成果。从面向存储的XML数据压缩技术、面向查询的XML数据压缩技术和面向特定应用的XML数据压缩技术三个方面综述了XML数据压缩技术的研究进展,讨论了目前存在的主要问题和需要进一步研究的方向,并提供了广泛的参考文献。 相似文献
7.
XML数据库技术研究 总被引:17,自引:0,他引:17
XML database is a new database technology. This paper gives an overview about the last research about XML database and its related productions ,then comparing XML database with traditional RDBMS. We analyze and point out some weaknesses about XML database,and give out our viewpoint. 相似文献
8.
XML数据文档及其处理技术探讨 总被引:11,自引:1,他引:10
1.引言目前Internet上描述网页信息的HTML语言的元素类型是通用和描述性的,既不具备可扩展性,也不能有效地表示信息的结构和意义。这也就是许多搜索引擎往往针对用户输入的关键词却返回大量垃圾数据的根源。XML的出现给了人们一条解决这一问题的途径。XML是用于描述结构化数据的元标记语言,是结构化文档和数据的统一格式,提供了一个对数据的内容进行更精确声明,及为对多个松散的应用进行更有意义的搜索,得到精准的结果集提供了一个标准。 相似文献
9.
随着XML文档的广泛应用,使用实体识别技术对XML文档数据质量进行管理变得非常重要。 XML中实体识别技术主要用于在XML文档中发现同一实体的不同描述,其在数据质量管理中可以用于错误检测、数据集成等。由于XML文档是半结构化的, XML文档上的实体识别与纯文本和关系数据上的实体识别有着很大不同。文中介绍了XML文档上实体识别的概念和应用,分别讨论了 XML文档上几种实体识别技术的概念和原理,给出了相应的树匹配算法,最后得出结论并展望了未来的研究方向。 相似文献
10.
浅析电子商务中XML数据交换技术的运用 总被引:3,自引:0,他引:3
本文根据XML数据交换技术的特点,作者结合XML的四种相关技术。详细阐述了XML技术在电子商务中的应用,特别介绍了XML技术实现异构数据库间互访的特性。 相似文献
11.
XML即可扩展标记语言,是为了在网络中说明和交换数据而制定的标准数据格式,而作为数据载体的XML文档的体积也随着交换数据增多而变得越来越大,这给网络上的数据传输造成了很大的负担.为此,先把数据库里的数据生成XML,再加工成压缩包,就是每一条数据都是xml.zip的压缩包,利用C#编写定时程序进行定时压缩,不用手动,最后用于数据推送. 相似文献
12.
13.
14.
XML已成为各种网络应用中数据存储和数据交换的标准.XML数据管理面临的最大困难在于结构与数据混合存储导致大量数据冗余,这极大地增加了XML数据存储、交换和处理的代价.对XML文档进行压缩可以在一定程度上解决这个问题.但现有XML压缩方法大都仅压缩单文档中的冗余信息.利用XML文档间的相似性,提出一种支持查询的多XML文档压缩存储方法XCluster.XCluster先利用XML有根有序标签树上改进的pq-gram近似距离对XML文档集进行层次聚类;然后合并每个聚类结果子集中文档的结构得到结构代表并进行字典编码压缩;同时合并不同文档内同一标签下的值内容,并根据其数据类型进行相应编码压缩.实验结果表明,在真实和生成的XML多文档数据集上,XCluster比XGrind和XQilla具有更好的压缩效果和查询效率. 相似文献
15.
大规模的云渲染技术带来了大量的三维图形渲染数据。为了减小集群渲染产生的图像序列数据的传输以及存储代价,针对渲染图像序列低熵的特点,基于字典编码技术提出了降低数据局部复杂性的无损数据压缩方案。该方案通过数据重排技术来大大提高数据的局部冗余度,从而提高数据无损压缩效率。为了进一步解决大规模图像序列的压缩耗时问题,提出了一种云计算平台上的分布式图像压缩处理方案,充分利用现有云计算中Map/Reduce计算模型实现了分布式编码方案。实验结果证明,对于渲染产生的大规模低熵图像序列,提出的方案能够有效提高编码率并减少编码时间。 相似文献
16.
面向XPath执行的XML数据流压缩方法 总被引:13,自引:0,他引:13
由于XML(extensible markup language)本身是自描述的,所以XML数据流中存在大量冗余的结构信息.如何压缩XML数据流,使得在减少网络传输代价的同时有效支持压缩数据流上的查询处理,成为一个新的研究领域.目前已有的XML数据压缩技术,都需要扫描数据多遍,或者不支持数据流之上的实时查询处理.提出了一种XML数据流的压缩技术XSC(XML stream compression),实时完成XML数据流的压缩和解压缩,XSC动态构建XML元素事件序列字典并输出相关索引,能够根据XML数据流所遵从的DTD,产生XML元素事件序列图,在压缩扫描之前,产生更加合理的结构序列编码.压缩的XML数据流能够直接解压缩用于XPath的执行.实验表明,在XML数据流环境中,XSC在数据压缩率和压缩时间上要优于传统算法.同时,在压缩数据之上查询的执行代价是可以接受的. 相似文献
17.
数据的爆炸式增长和有限的带宽使得数据压缩日渐重要,但是对于关键和敏感数据只是单纯地进行压缩会面临泄漏和窃听等信息安全风险,因此还需要对压缩后的数据进行加密。为解决软件压缩加密速度慢、占用大量CPU资源的缺点,论文实现了同时具有LZ4数据压缩模块和AES加密模块的FPGA硬件加速电路,并且修改了LZ4部分数据格式以适应硬件的运行,通过乒乓操作进一步优化了硬件的性能。在Vivado 2016.4中进行了Verilog代码的设计和仿真,然后在Xilinx KC705评估板上进行了实现和测试,最高实际测试频率达到了220MHz,流水线的设计使得吞吐率可达1760Mbps,性能超过了之前已有的最佳设计。 相似文献
18.
为了研究LZ77算法的对文本文件的压缩性能,在分析LZ77算法的基础上给出了实现压缩和解压缩软件的方法,并且采用该软件分别对英文文本和中文文本压缩情况进行了测试,最后给出了测试结果分析。 相似文献
19.
XML(extensible markup language)文档已经被广泛用作应用程序的一个数据交换格式,针对XML数据的压缩技术也逐渐成为新的研究领域。提出XSLC(XMLstream layered-coding compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元素的父子关系进行子元素层面的编码;同时根据数据类型进行数据压缩,能够在压缩之后的文档上进行查询,因为仅需一遍压缩扫描所以可以应用于数据流环境。实验表明:XSLC算法的压缩比率和压缩时间均优于传统算法。 相似文献