首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
王国仁  汤南  于亚新  孙冰  于戈 《软件学报》2006,17(4):770-781
主要研究XML文档的并行数据分片策略,以便能够并行处理XML查询.为了描述XML数据分片,提出了媒介节点的概念.一组媒介节点的集合可以将一棵XML数据树分割成一棵根树和一组子树的集合:根树将在所有站点中复制;而子树集合则可以根据用户查询的工作负载被均匀地分片到各个站点中.对于同一棵XML数据树,会有很多种媒介节点的集合;而不同的媒介节点集合会产生不同的数据分片结果.然后,依据各个数据分片中的用户查询工作量是否均衡,来衡量一个分片的好坏.选择一组最佳的媒介节点集合是一个NP-hard问题.为了解决此问题,设计了一组启发式优化规则.基于这一思想,提出并实现了一种基于媒介节点的XML数据分片算法WIN(workload-aware intermediary nodes data placement strategy).大量实验结果证明:WIN算法的性能要优于以往的并行XML数据分片策略.  相似文献   

2.
并行XML数据库系统中数据分片策略的研究   总被引:5,自引:0,他引:5  
数据分片策略是影响并行数据库系统性能的重要因素之一.着重探讨并行XML数据库系统中大规模XML文档的数据分片问题,提出与传统数据库分片策略不同的两种新的分片方法:基于路径模式的路径实例平衡法(PSPIB)和基于结点模式的结点轮循法(NSNRR).前者的思想是析散DOM树中具有相同路径模式的路径实例,将其分配到不同站点;后者的思想是将DOM树中具有不同结点模式的元素结点以轮循方式析散到不同站点,而将具有相同结点模式的元素结点聚簇到同一站点.还介绍了这两种分片策略的实现,并给出了相应的基于RPE查询的性能测试、分析和评价.  相似文献   

3.
XML数据库的并行RPE查询   总被引:1,自引:0,他引:1  
1.引言随着Internet应用的不断发展和日益普及,Internet上信息的定义和表示成为了重要的技术标准。目前,HTML标记语言由于其简单、易用等特点,已经成为广泛采用的一种标记语言。但是随着Internet上的信息量迅速地增长,在浩如烟海的信息中检索需要的内容变得越来越困难。HTML只是简单标记文档的展示格式,而不能把文档中的语义结构有效地表示出来,因而诸如Yahoo,Google等搜索引擎只能用关键字  相似文献   

4.
结构连接作为XML查询的重要部分,对查询性能来说起着非常重要的作用.目前有几种结构连接算法已经被提出,例如Stack-Tree、XR-tree.这些算法主要集中在节点之间关系的确定上.与之不同,作者从分片的角度去解决结构连接问题,首先把节点间的关系引申到分片之间的关系,从而得出各分片之间的一些性质,再利用分片间的性质来提高结构连接操作的性能.文中提出了一种基于分片的结构连接算法和两种优化方法,实验表明该算法在性能上要优于Stack-Tree算法和XR-tree算法.设计了一个简单而又高效的索引结构来存储分片结果,实验结果表明该索引结构的维护代价要小于XR-tree的维护代价.  相似文献   

5.
针对海量XML文档查询复杂等问题,本文尝试通过XML键约束及其矢量化操作,根据混沌原理,融入蚁群聚类算法构建并行XML数据库分片新模型(简称ACC);通过定义相应混沌适应度函数衡量蚂蚁与其邻域的相似程度,让整个人工蚁群在移动中动态地形成多个独立的子群体,同时对函数参数进行自适应的调整,使得人工蚁的移动仅仅使用少量的局部信息,加快XML分片速度并且提高分片质量.对比其它XML分片算法,一系列仿真实验表明利用混沌蚁群模型分片XML,在模型上更直观,计算代价较小.  相似文献   

6.
主要研究XML中间件的分布式异构数据库的数据分片策略,以便能够并行处理XML查询。为了描述XML数据分片,提出了对象树、子树的概念,将一棵XML数据树分割成对象树和子树,对象树在各个站点上复制,子树标签化后均匀分片到各个站点上。为了实现用户数据分片查询工作量的均衡,对最大树深的子树采用减治法策略,减治法策略后的子树又分配到一个新的站点上。基于这一思想,提出并实现其算法。实验结果证明:在分布式异构数据库的检索、查询和访问中,基于对象树、子树的数据分片算法的性能要比PSPIB算法性能优越。  相似文献   

7.
李润洲 《福建电脑》2007,(3):154-155
针对软件项目文档在实际使用过程中所存在的问题,本文提出了一种将软件工程过程中提交的各类文档进行统一组织的框架模型;阐述了基于XML组织文档内容的录入与查阅方法的设计与实现.  相似文献   

8.
9.
概率XMI、是描述不确定数据的有效方式,Dcwcy编码是一种重要的XMI、文档关键字索引编码技术。在概率XML大文档关键字索引检索过程中,频繁地比较关键字索引Dewey编码非常耗时。针对上述问题,对概率XML文档进行分区,并设计了适合概率XML文档特点的关键字索引的Dewey编码策略,提出了一种概率XML文档Top-k关键字并行检索算法PTKS(Parallcl Top-k Keyword Scarch Algorithm)。实验证明,P"I'KS提高了概率XM工文档关键字检索的时间效率,尤其在文档结构复杂度高的情况下检索效率提高更加显著。  相似文献   

10.
一种基于XML的数据集成系统及实现   总被引:15,自引:0,他引:15  
使用DBMS管理半结构数据具有这样一个优点,即可以较容易地从异构数据源或WWW上集成信息,而且其转换代价较低,文中就与半结构数据集成有关的问题,如半结构数据集成系统的体系结构等问题进入深入的分析和研究,并在此基础上实现了一种基于XML的数据源集成的Wrapper原型系统。  相似文献   

11.
目前已经提出了多种查询XML数据的方法,然而这些传统的方法不能充分利用多处理器和多核心处理器的优势。本文提出了一种XML查询的并行算法,大幅提高了共享存储器多处理器、多核心处理器系统中XML数据的查询效率。  相似文献   

12.
在现有研究的基础上提出了一种基于式样单(stylesheet)划分的XML数据并行转换方法,并针对该方法所涉及的以下关键问题进行了讨论:1)如何从式样单中获得多个相互独立的转换单元,它们可以并行执行而互不影响;2)如何根据运行环境自动调整转换任务的数量和负载;3)如何将多个并行转换得到的结果进行有效的合并。将提出的算法应用于实际的Open XML-UOF文档格式转换项目,取得了很好的效果。该方法对于在并行环境下有效地提高XML的数据转换性能具有较大的应用价值。  相似文献   

13.
针对保持结构的XML压缩数据,提出一种专门针对压缩XML数据的查询代数ACX(algebra of compressed XML),讨论了ACX逻辑操作符及物理操作符.ACX的部分设计已在关系及XML双引擎数据库管理系统CoSQL RX得到实现和验证.  相似文献   

14.
在开展数据处理和数据分析的工作前,常常需要对采集的原始数据进行解析处理,常规的方法是针对大量的数据接口分别开发解析代码,这样做不仅工作量大,代码冗余度高,日后对接口进行修改或添加时都需要同步修改解析程序的相应代码,给数据分析处理工作带来极大的困难。为了有效解决这一问题,该文提出了一种基于XML的数据解析方法,实现接口定义和程序编码的隔离,能够在不改动程序代码情况下,实现数据接口的按需添加或修改,有利于节约后期针对解析程序的开发和维护成本。  相似文献   

15.
首先给出了XML文档树、元素外延和名字路径等的形式化定义.接着,将编码方案、路径索引和名字外延的思想相结合,提出了一种改进的XML数据的索引结构(类型索引集、名字索引集和外延索引),解决了基于传统索引技术的XML数据查询方法性能上的不足.它既可以有效地支持结构连接的计算以快速地判断任意结点之间的子孙后代关系,也可以有效地支持基于名字外延的路径连接算法以快速地判断任意结点之间的父子关系,然后还可以快速地支持对包含拥有关系的小枝查询;进而给出了基于该索引结构的外延连接算法,并着重对其处理含有父子关系和拥有关系等较复杂的XPath查询路径的不同处理过程进行了对比和分析,使得对于一条长度为n的XPath绝对路径查询,最多只需要n/2-1次外延连接,且能够根据双亲结构信息等利用外延索引尽可能跳过不需要参与连接的结点.实验结果表明,提出的新的索引结构可以有效地提高查询处理的性能.  相似文献   

16.
17.
大流量网络平台下并行数据库的设计与实现   总被引:2,自引:0,他引:2  
随着计算机网络的迅猛发展,网络速度已经从10Mb/s、100Mb/s达到了1Gb/s,因此,一般工作在网络平台下的数据库随着数据量的增加,往往难以满足用户的需求。因此,该文将并行处理与数据库技术相结合,设计并实现了应用于大流量网络平台的并行数据库。  相似文献   

18.
意大利人E.Damiani提出了一种XML访问控制模型(ED模型),但是该模型存在着要维护大量用户视图和查询时需重复解析等问题。通过引入数据库系统的支持,在数据库核心层实现采用ED模型的XML访问控制系统,可以有效地解决这些问题,并以实验验证了系统的效果和性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号