首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
在进行信息系统的开发过程中,在word文档中特定位置填入从数据库中读取的数据资料来自动生成word文档报告,已成为办公自动化系统的重要组成部分。分析了传统word对象模型生成海量表格数据速度慢的弊端,结合微软Office Word2003对XML的支持特性,通过Word文档和XML文档的相互转换,提出利用StringTemplate将DataTable的数据转换成特定格式的xml字符串,实现海量表格数据的快速导出。  相似文献   

2.
XML已成为各种网络应用中数据存储和数据交换的标准.XML数据管理面临的最大困难在于结构与数据混合存储导致大量数据冗余,这极大地增加了XML数据存储、交换和处理的代价.对XML文档进行压缩可以在一定程度上解决这个问题.但现有XML压缩方法大都仅压缩单文档中的冗余信息.利用XML文档间的相似性,提出一种支持查询的多XML文档压缩存储方法XCluster.XCluster先利用XML有根有序标签树上改进的pq-gram近似距离对XML文档集进行层次聚类;然后合并每个聚类结果子集中文档的结构得到结构代表并进行字典编码压缩;同时合并不同文档内同一标签下的值内容,并根据其数据类型进行相应编码压缩.实验结果表明,在真实和生成的XML多文档数据集上,XCluster比XGrind和XQilla具有更好的压缩效果和查询效率.  相似文献   

3.
原生XML存储方案直接关系到查询处理和数据更新。目前的原生XML存储方案大多关注于查询处理而很少涉及对数据更新的支持。与关系表的更新不同,XML更新要考虑到节点的文档顺序。提出了一种新的原生XML存储更新机制,它既保持了节点的文档顺序,又使更新操作局限于一个页面之内,保证了更新的效率。通过引入前向链接记录和重定位记录,该更新机制使页面分裂时记录存储地址保持不变,避免了索引更新的I/O开销。通过实例说明该原生XML存储方案的数据更新机制是有效的。  相似文献   

4.
手工编辑生成XML数据文档不能适应快速大量的数据交换要求。编写代码也很难满足灵活多变的应用需求。尽管代码结构类似,却不能直接重用。这使得每次工作都得从零开始。文中提出了一种基于UML的XML描述方法,可以自动将关系数据库中的数据转换成XML数据文档,且描述简单容易,方便转换成基于不同平台的代码。  相似文献   

5.
手工编辑生成XML数据文档不能适应快速大量的数据交换要求.编写代码也很难满足灵活多变的应用需求.尽管代码结构类似,却不能直接重用.这使得每次工作都得从零开始.文中提出了一种基于UML的XML描述方法,可以自动将关系数据库中的数据转换成XML数据文档,且描述简单容易,方便转换成基于不同平台的代码.  相似文献   

6.
基于扩展编码的在线XML文档加载机制   总被引:1,自引:0,他引:1  
Webservices应用中存在大量在线XML文档处理的需求,利用现行的XML数据处理方法来处理上述在线文档是一项可行方案,在线文档的加载问题应运而生;目前对XML数据的存储和查询都是基于对XML文档树的某种编码方法,使用扩展编码方法以提高文档更新性能;如何基于扩展编码方法完成对在线文档加载的研究目前还比较少.提出一种新的扩展编码方法,在此编码的基础上,提出一种适合在线XML文档的加载方法,通过统计同模式的XML文档特征和更新特征,一遍解析文档完成扩展编码和加载;实验结果表明,加载效率和更新性能较好.  相似文献   

7.
通过对怎样使用XML和数据库进行了总体回顾,描述了以数据为中心和以文档文中心的文档之间的差异如何影响其在数据库中的应用,以及SQL Server2000如何实现对XML的支持,并给出实例语句进一步说明通过HTTP访问SQL Server的主要方法.  相似文献   

8.
XML正成为Internet上数据描述和交换的主要标准,因此对面向对象XML存储研究变的很重要。扩展后的XMLSchema支持面向对象XML,通过对XMLSchema文档的解析得到面向对象XML文档中元素之间的关系,这些关系不仅支持新的数据模型,而且支持新的查询方式。在扩展XMLSchema的语法后,介绍扩展后XMLSchema中继承信息查找的算法设计。  相似文献   

9.
针对支持查询的XML数据压缩方法存在的路径和数据重复等问题,通过去除XML数据中的重复路径,简化XML数据结构,提出结构标记树的概念及其生成算法,设计一种基于结构标记树的可查询XML数据压缩方法SSTQC,对XML数据进行压缩和组织查询。SSTQC一次扫描XML文档,具有较好的的压缩性能和查询效率。  相似文献   

10.
C++中的XML数据绑定   总被引:1,自引:0,他引:1  
在应用程序中访问XML文档有DOM的树结构、SAX流模型,以及XML数据绑定的方法。前两种方式在XML文档和应用之间处理大量的数据时非常麻烦,而数据绑定是处理大量数据的好方法。文中从XML模式描述C 结构的基础出发,实现了把有效的XML文档绑定到结构,在C 程序中,通过调用通用的打包和解包接口函数解决了结构实例和XML文档数据之间的直接转换,而不需过多的处理。  相似文献   

11.
基于XML的异构数据库的中间件的设计与研究   总被引:2,自引:0,他引:2  
阐述了中间件及使用XML文档作为中间数据,在异构数据库之间进行中间件数据传输的设计与研究,并使用XML文档来设计各数据库与XML之间的数据类型映射.  相似文献   

12.
一种基于RDBMS的XML数据的存储方法   总被引:1,自引:0,他引:1  
XML作为一种数据交换的标准在互联网上推出,使得XML数据和数据库的相互交换成为必要:一是因为WEB中大量的多样化数据需要进行有效的存储和管理;二是因为在现有的数据库中存储有大量的数据并且需要将这些数据转换为XML发布到WEB中。论文提出了一个基于关系数据库的数据转换框架,基于数据的完整性讨论XML数据存储策略。建立一个XML通用数据模型,把文档树分解成多个节点,根据一定的映射规则存储到关系表中,从而不用考虑文档的模式信息(DTD、XMLSchema)。最后通过一个具体的文档实例来说明这种策略的有效性。  相似文献   

13.
The ability to reliably merge independent updates of a document is a crucial prerequisite to efficient collaboration in office work. However, merge support for common office document standards like OpenDocument or OfficeOpenXML is still in its infancy. In this paper, we present a consistent versioning model for XML documents in general including merge support. This is achieved by using context-aware fingerprints that identify edit operations and allow for a conflict detection. We show how to extract tracked changes from office documents and map them on our delta model. Experimental results indicate that our fingerprinting technique is efficient and reliable.  相似文献   

14.
XML has recently become very popular as a means of representing semistructured data and as a standard for data exchange over the Web, because of its varied applicability in numerous applications. Therefore, XML documents constitute an important data mining domain. In this paper, we propose a new method of XML document clustering by a global criterion function, considering the weight of common structures. Our approach initially extracts representative structures of frequent patterns from schemaless XML documents using a sequential pattern mining algorithm. Then, we perform clustering of an XML document by the weight of common structures, without a measure of pairwise similarity, assuming that an XML document is a transaction and frequent structures extracted from documents are items of the transaction. We conducted experiments to compare our method with previous methods. The experimental results show the effectiveness of our approach.  相似文献   

15.
文档有效性检验是XML领域的一个基本问题.Active XML(AXML)文档在XML文档中引入Web服务,传统用于解决XML文档有效性的检验方法并不适用于AXML文档,为文档有效性检验提出了新的挑战.研究了AXML文档有效性检验问题,在原始树自动机的基础上,定义了AXML模式树自动机-ASTA机,该树自动机能够有效地描述满足AXML模式约束的文档集合.基于ASTA机,提出了一种多项式时间的AXML文档有效性检验算法.实验数据表明,基于提出的算法能够有效的完成对AXML文档的有效性检验.  相似文献   

16.
XML文档相似性的仿真研究   总被引:1,自引:0,他引:1  
XML文档相似性的计算是XML文档分类中的一个难题。文中描述了一种基于结构的方法,通过序列化模式挖掘方法,挖掘出两个文档之间的最大相似路径,从而可以通过计算最大相似的路径的节点数目和所有路径的节点数目的比值,得到两个文档之间的相似度。文章提出了一种新的最小化XML文档的方法,并且综合考虑了文档节点的语义相似度和结构相似度,从而进一步地提高了计算文档相似度的精度。实验表明,该方法有着良好的应用前景。  相似文献   

17.
The use of digital document management and processing is increasing. Traditional workflows of paper forms are being replaced by electronic workflows of digital documents. These workflows often require multiple signatures to be added to the documents for authorization and/or integrity. We describe examples of digital workflows that illustrate problems with digital signatures: i.e. the use of digital signatures across entire documents results in signatures that can be unnecessarily invalidated by subsequent modification of the document. We propose the use of fragment signatures, which reduce unnecessary invalidation of signatures and enable greater concurrency in workflows. Our approach is document‐centric and does not use a centralized database. We report on an implementation that allows fragment signatures over document fragments as well as the attachment (or embedding) of other documents. This allows collaborative or cooperative editing to occur on parts of a document without disturbing unrelated signatures. We describe the lessons learned from our deployments and offer further ways to embed such signatures into other document types. Copyright © 2010 John Wiley & Sons, Ltd.  相似文献   

18.
基于频繁结构的XML文档聚类   总被引:1,自引:1,他引:0       下载免费PDF全文
研究基于频繁结构的XML文档聚类方法,其频繁结构包括频繁路径和频繁子树。首先介绍一种挖掘XML文档中所有嵌入频繁子树的算法SSTMiner,对SSTMiner算法进行修改,得到FrePathMiner算法和FreTreeMiner算法,分别用于挖掘XML文档中最大频繁路径和最大频繁子树,在此基础上,提出一种凝聚的层次聚类算法XMLCluster,分别以最大频繁路径和最大频繁子树作为XML文档的特征,对文档进行聚类。实验结果表明FrePathMiner算法和FreTreeMiner算法找到频繁结构的数量都比传统的ASPMiner算法多,这就可以为文档聚类提供更多的结构特征,从而获得更高的聚类精度。  相似文献   

19.
吕锋  余丽 《微机发展》2007,17(6):53-55
文中介绍了三种常用的Web数据抽取的方法:直接解析HTML文档的方法,基于XML的方法(也称作为分析HTML层次结构的方法)以及基于概念建模的方法。重点研究其中的基于XML的数据抽取方法,基本做法是将原始的HTML文档通过一个过滤器检查并修改HTML文档的语法结构,从而形成一篇基于XML的XHTML,然后利用XML工具来处理这些HTML文档。实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程,给在Web挖掘中使用传统的数据抽取方法进行数据抽取创造了有利条件。  相似文献   

20.
基于XML的PDF文档内容与结构的表示的实现   总被引:2,自引:0,他引:2  
在对网络信息资源进行检索、过滤、提取的过程中,对于文档格式的转换是进行信息处理的必然途径。将PDF文档转换为XML文档,在对分析PDF文档的内容和结构方面具有重要意义。论文介绍了从PDF文档向XML文档转换的设计和实现原理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号