首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 281 毫秒
1.
针对XML文件的特点,提出一种对XML文件建立索引的方法。该方法所采用的数据结构和算法,在充分利用XML文件的标记所隐含的上下文信息提高查询准确率的同时,有较小的索引冗余和较快的查询速度。  相似文献   

2.
对海量的、异构XML文档进行检索时,现有的查询语言如XPath,XQuery已无法胜任,需要将数据挖掘和信息检索两方面相结合进行近似查询.提出一种新的XML文档近似查询方法,首先根据提出的层次路径模型提取文档结构特征,进行向量空间映射.然后通过奇异值分解进行矩阵变换,在去除相关冗余的同时有效地降低了空间维数.目标文档的匹配在变换后的检索空间中进行,同时对返回的查询结果进行相似性排序.采用DBLP数据集进行测试,实验获得良好的查询及排序结果.  相似文献   

3.
针对已有XML查询语言的不足,提出一种新的XML数据查询语言X-SQL.X-SQL具有类似于SQL语言的Select-From-Path-W here结构、具有路径表达式查询能力和同时从多个数据源选取数据的能力,支持数据更新操作和查询结果的语义描述.  相似文献   

4.
针对XML时态查询问题,使用CB+-tree索引,将时态信息作为索引关键字,采用实体地址和长度随机读取查询,在叶子节点处添加新的链表节点,对叶子节点中的关键字按照tend进行二次排序,减少了查询比较次数。实验结果表明,CB+-tree索引在实现实体轨迹、快照和时间段3类时态查询时,优于B+-tree索引,特别是对于大容量的XML文档,其时态查询效果更佳。  相似文献   

5.
针对可扩展标记语言(XML)查询中具有嵌套OR谓词的复杂小枝模式查询处理,提出一种基于路径连接的查询方法.该方法以路径为分解粒度,结合分支扩展(AOBE)的概念,通过路径连接过程实现对复杂小枝模式查询的整体处理.为了进一步提高算法效率,在已有研究的基础上挖掘相应的优化规则,利用索引跳过那些明显不参与连接的元素的访问和计算.与已有算法相比,基于路径连接的查询方法大大简化了复杂小枝模式查询处理过程,只访问查询叶节点对应的元素,可以显著减少结构连接的操作数目和扫描元素的个数.实验结果表明,该方法能够有效地改善复杂小枝模式查询处理的性能.  相似文献   

6.
与标准的方法XQuery查询语言不同,XML文档的关键字查询能使用户方便地访问XML数据,不必考虑数据复杂模式和掌握复杂查询描述语言。文章对关键字查询中索引技术进行研究,提出了一种基于Dewey编码的查询索引进行解决,以综合分析XML数据的值信息和结构信息,达到子树返回和路径返回的精确查询的目标。  相似文献   

7.
针对在XML流上执行XQuery查询处理,精确输出查询结果的问题,给出了一种基于XML更新流的解决方案.在XML流中动态地插入更新事件,得到XML更新流,以达到获取连续精确的结果.XQuery查询语言在XPath路径查询的基础上使用FLWOR表达式实现XML数据流的复杂查询.将主Xpath式进行提取,分出绝对路径和相对路径,把有依赖关系的路径进行合并,重写FLWOR表达式,提高XQuery的查询效率.实验结果表明,提出的方法能够提高执行效率,得到精确的查询结果.  相似文献   

8.
提出一种新型XML数据存储和查询的方法,解决了XML文档有效的存储和查询复杂的问题.采用SAX技术输出XML流,并通过对哈夫曼编码的分析,对XML文档中各个元素生成基于哈夫曼编码加以扩展,并随元素信息存入关系数据库.即在关系数据库中存放结点信息及结点之间的关系,使查询结点与子结点信息更方便,实现以文档为中心的文档粒度较大的文档的存储和查询.应用SAX技术生成扩展的哈夫曼编码,存储结点的信息,方便地实现XML文档信息的查询.基于扩展哈夫曼编码的XML有效地提高了XML文档存储和查询效率,在应用中具有一定可行性.  相似文献   

9.
现有的XQuery处理策略有基于核心语法一次一结点的方法和基于代数的一次一集合2种,单独使用这2种方法都不能很好地解决XQuery查询处理和查询优化问题.该文提出了一个有效的XML代数系统-ETA.总结已有的XML代数的工作,分析新的XML查询问题,并在前述2种策略的思想的基础上提出了操作范围的概念.提出XML代数查询优化策略,主要包括选择谓词下移、抽取下移与分合、抽取替代自连接以及XML函数依赖及键约束等策略.ETA代数能够表达W3C的用例和XMark测试集的所有查询,查询效率得到提高.  相似文献   

10.
为了解决在多文档下插入节点或需要修改节点编码时查询效率比较低的问题,提出了一种有效的结构连接算法.在分析现有单文档下的XML结构连接算法基础上,对祖先/后裔与双亲/孩子结构查询进行改进,基于归并思想解决多文档下的结构连接,以适应在面向方面的XML Schema中定义的基于多文档的查询.改进后的结构连接算法可以进一步利用XML数据的特点、索引和织入文档信息减少连接扫描的代价,具有一定的合理性、有效性和实用性.  相似文献   

11.
随着XML应用的发展,利用XML发布网上信息已经逐渐成为一种趋势。如何快速、准确的获取所需的信息已经成为人们研究和关注的热点。该文在介绍XML查询及压缩索引机制的基础上,提出了基于XS树的新型压缩索引结构,并给出了XML索引更新机制的算法,该结构可有效的结合倒排索引和路径信息,实现对路径和文本内容更好的检索。实验表明查询效率高于当前的主流结构连接算法。  相似文献   

12.
为了提高不确定XML数据管理和查询处理效率,基于不确定XML的可能世界语义的概率XML模型,采用具有独立分布和互斥分布的两种不确定文档节点类型,研究了概率XML文档可能世界实例生成问题,提出了具有线性时间复杂性的概率XML文档实例生成算法,该算法通过随机选择分布节点的孩子节点子集,根据该节点子集生成随机XML文档实例,该实例可用于处理不确定XML数据查询、索引等XML数据管理问题。实验分析验证了该算法具有良好的实用性和高效性。  相似文献   

13.
时态数据的多种查询操作要求数据以时间为基准成组存放,XML文档中数据的半结构化特性很好地适应了这一要求.在不考虑索引技术等查询优化方法的情况下,时态数据文件的长度是影响查询效率的关键因素之一.首先探讨了两种常用的表示时间属性的方法:属性时戳模型和元素时戳模型;提出了一种新的方法:前缀时戳模型.在3种时态XML数据模型的基础上,利用XML文档中祖先元素与子孙元素在时间区间上的相关性,消除了文档中的时间冗余信息,实验结果表明这一方法能够取得较好的压缩比.  相似文献   

14.
介绍了一种用于支持复杂XML数据查询优化的XML查询代数XQA以及用于实现XQuery语言的中间语言FXQL,进而提出了一种基于XQA代数的去除相关性方法(de-correlation),通过查询重写引入连接运算的方法,使得人们有可能更多地利用高性能的连接算法来提高查询效率.在扩展了广义表结构的XDM数据模型的基础上,这种查询重写通过FXQL语言的程序变换方法来实现,易于与各种函数式语言编译优化技术相互结合.实验结果证明了该方法的有效性.  相似文献   

15.
目的提出一种XML文档存储和查询方法,解决XML文档有效的存储和查询,避免处理XML数据时进行多级复杂的转换.方法充分利用关系数据库成熟技术,有效实现大量数据的存储和查询.采用SAX技术解析XML文档,并通过对现有哈夫曼编码进行扩展,实现将XML文档结点信息和属性以关系结构进行存储和查询.利用扩展后的哈夫曼编码来存储结点信息和结点之间关系.结果通过遍历XML文档生成了XML文档对应扩展哈夫曼编码,实现了XML文档信息以关系数据形式存储和查询,并实现了SQL语句与XML查询语句的转换.结论基于扩展哈夫曼编码结点映射的存储与查询方法能较好地实现结点信息与结点关系的存储,并有效地实现查询,在应用中具有一定可行性.  相似文献   

16.
XML与RDB的同步修改是基于RDB的XML管理技术中实现XML视图与底层RDB数据一致性的根本保障,有关XML修改及其与RDB集成后的同步修改技术的研究尚未系统开展。文中提出了一种XML修改语言原型FLWU(FOR、LET、WHERE、UPDATE);通过FLWU到SQL的转换及两者之间同步执行机制的建立,实现XML与RDB的同步修改,从而保证基于RDB的XML数据管理中XML视图与底层RDB的数据一致性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号