首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 203 毫秒
1.
为了提高不确定XML数据管理和查询处理效率,基于不确定XML的可能世界语义的概率XML模型,采用具有独立分布和互斥分布的两种不确定文档节点类型,研究了概率XML文档可能世界实例生成问题,提出了具有线性时间复杂性的概率XML文档实例生成算法,该算法通过随机选择分布节点的孩子节点子集,根据该节点子集生成随机XML文档实例,该实例可用于处理不确定XML数据查询、索引等XML数据管理问题。实验分析验证了该算法具有良好的实用性和高效性。  相似文献   

2.
为高效地实现XML多分支路径查询,提出了基于索引的XML多分支路径查询算法depthjoin.首先对XML文档进行编码并创建索引,然后对查询树进行查询匹配.采用栈存储多分支路径中的单路径,对多分支结点采用索引信息判定其子结点是否具有共同的祖先结点或父结点.与现有的XML分支查询算法相比,算法depthjoin充分利用索引,不需要进行单路径的连接操作,实验表明其查询效率比现有的查询算法高.  相似文献   

3.
提出一种基于XML的文档图像在原生数据库中存储和检索的新方法,该方法将文档图像切分标记为XML文档,将此类XML文档存储到原生数据库中;利用XML:DB API接口对XML数据进行查询和管理,XSL样式表完成XML数据的显示.  相似文献   

4.
目的提出一种XML文档存储和查询方法,解决XML文档有效的存储和查询,避免处理XML数据时进行多级复杂的转换.方法充分利用关系数据库成熟技术,有效实现大量数据的存储和查询.采用SAX技术解析XML文档,并通过对现有哈夫曼编码进行扩展,实现将XML文档结点信息和属性以关系结构进行存储和查询.利用扩展后的哈夫曼编码来存储结点信息和结点之间关系.结果通过遍历XML文档生成了XML文档对应扩展哈夫曼编码,实现了XML文档信息以关系数据形式存储和查询,并实现了SQL语句与XML查询语句的转换.结论基于扩展哈夫曼编码结点映射的存储与查询方法能较好地实现结点信息与结点关系的存储,并有效地实现查询,在应用中具有一定可行性.  相似文献   

5.
随着XML应用的发展,利用XML发布网上信息已经逐渐成为一种趋势。如何快速、准确的获取所需的信息已经成为人们研究和关注的热点。该文在介绍XML查询及压缩索引机制的基础上,提出了基于XS树的新型压缩索引结构,并给出了XML索引更新机制的算法,该结构可有效的结合倒排索引和路径信息,实现对路径和文本内容更好的检索。实验表明查询效率高于当前的主流结构连接算法。  相似文献   

6.
基于区间编码的有效XML结构连接   总被引:1,自引:0,他引:1  
给出了XML文档的文档树数据模型,并对文档树上各结点进行区间编码.通过改进基于缓存的归并结构连接算法,提出了一种新的处理结点包含关系的有效结构连接算法,该算法只需要对祖先结点集和后裔结点集各扫描一次,即可完成结构连接,甚至可以跳过那些无需参与连接的祖先或后裔结点,从而更快地完成结构连接.  相似文献   

7.
为实现XML数据到关系数据库的映射,提出一种基于模型的映射方案,可以将任何一个格式良好的XML文档存储到结构固定的关系模式中,实现结构互异的XML文档的固定关系模式存储,不受DTD变化的约束,同时在存储的过程中自动插入节点的Dewey编码及深度。利用JDOM提取XML文档信息数据,给出了附加Dewey编码的映射算法实现,实验结果表明该方案设计合理、有效。  相似文献   

8.
提出一种新型XML数据存储和查询的方法,解决了XML文档有效的存储和查询复杂的问题.采用SAX技术输出XML流,并通过对哈夫曼编码的分析,对XML文档中各个元素生成基于哈夫曼编码加以扩展,并随元素信息存入关系数据库.即在关系数据库中存放结点信息及结点之间的关系,使查询结点与子结点信息更方便,实现以文档为中心的文档粒度较大的文档的存储和查询.应用SAX技术生成扩展的哈夫曼编码,存储结点的信息,方便地实现XML文档信息的查询.基于扩展哈夫曼编码的XML有效地提高了XML文档存储和查询效率,在应用中具有一定可行性.  相似文献   

9.
指出了数据迁移测试领域中存在的问题.开发了异构数据库数据迁移测试软件,该软件使用JDBC接口连接访问数据库,采用XML文档存储测试数据,并建立了多层数据源结构,利用JDOM应用编程接口解析XML文档获取测试数据.该软件开发过程更加符合开发者的编程习惯,实现了测试数据的可重用以及DML语句的动态生成,达到了利用软件对迁移结果进行自动化测试的目的.  相似文献   

10.
针对向量空间模型在文档相似度量方面的局限,提出了基于计算公共子串的文档相似度量算法。对求公共子串算法进行了改进,提高了空间效率。用XML存储学生毕业设计论文文档,通过Java提供的DOM API生成文档对象树。深度优先搜索树中结点,进行结点比较,计算论文文档中出现的雷同文本,结合文档的结构相似性,能有效计算文档相似度。  相似文献   

11.
XML文档作为一种半结构化数据,与关系数据库中存储的结构化数据存在一定的差异。本文通过分析XMLSchema的结构和语法,借鉴P-Schema的思想,提出了一种名为E-Schema方法用于XML模式到关系模式的映射,解决了多值元素、可选元素、组元素的映射问题,能够在关系数据库中完整的保存XML文档的结构信息和数据信息,并提高了查询效率。  相似文献   

12.
为了提高数字地下空间数据库的存储效率与检索性能,设计基于可扩展标记语言(XML)的数字地下空间索引四叉矩形(QR) 树.该索引将检索过程涉及到的空间限制在整个索引空间的某一部分,XML利用其结构化的特点,改进了传统QR树索引文档与数据结构之间需要序列化的缺点,改善了因数据激增而下降的查找性能;同时利用XML的可扩展性,实现对索引信息规范化、结构化的描述,实现索引文档存储和数据结构组织的显式描述,解决了QR树存储开销较高、结点上溢和下溢问题,实现QR树动态维护,提高索引的稳定性.  相似文献   

13.
针对可扩展标记语言(XML)数据查询中的结构化匹配问题,提出一种位图过滤加速法,该算法能有效地提高XML结构化匹配效率。通过预先为每个XML节点建立标签位图,该加速法在XML结构化匹配中,能以位图比较形式过滤大部分未匹配节点,从而达到加速效果。研究位图过滤加速法与几类XML结构化匹配算法的集成问题,提出了低代价的融合方法。实验证明,集成位图过滤加速法的XML结构化匹配算法在查询效率方面明显优于原有算法。  相似文献   

14.
可扩展标记语言正在成为Web上各种应用交换信息的标准。对高性能可扩展标记语言数据处理技术的需求正日益增长。现有的大部分可扩展标记语言文档相似度计算方法是基于文档结构特征的。该文提出了一个新的基于综合语义的可扩展标记语言文档相似度计算方法。该方法综合利用了可扩展标记语言文档的结构信息和内容信息,具有一定应用前景。  相似文献   

15.
提出一种XML文档分类算法——IL-AdaBoost。算法以XML频繁变化子结构为特征构建决策树桩,作为boosting算法的弱分类器,并改进了AdaBoost算法;利用泊松过程模拟新增XML文档的生成,反映XML文档随时间增加的特性,更新样本分布,实现增量学习。利用采样改善基本分类器的差异性,提高集成学习效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号