首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
针对XML函数依赖(XFD)不能充分检测XML局部数据源语义上的数据不一致,借鉴关系数据库中条件函数依赖(CFD)的概念,并根据XML自身结构和约束特性,提出了基于内容感知发现(CAD)XML条件函数依赖(XCFD),CAD使用隐藏在数据值中的内容发现局部XML文档的XCFDs,检测异构数据源中数据一致性,提高数据的质量,并给出了详细的算法,同时引入修剪规则集减少搜索点阵和候选的XCFD的数量,提高算法的效率,使得XCFD无冗余、最小化.通过案例研究表明,基于CAD方法发现的XCFD比现有XFD发现更多的函数依赖和语义约束.  相似文献   

2.
XML上的函数依赖推理   总被引:18,自引:0,他引:18       下载免费PDF全文
谈子敬  庞引明  施伯乐 《软件学报》2003,14(9):1564-1570
函数依赖是数据语义的重要组成部分,这一概念被引入到XML的领域中.基于DTD,XML的树模型和路径表达式,对节点的值相等和路径节点集作了定义.在此基础上,研究了XML中函数依赖、逻辑蕴涵和路径闭包的概念,证明了函数依赖在给定DTD上的可满足性.提出了一个XML上函数依赖的正确和完备的推理规则集,并给出了一个用于计算路径闭包的算法.  相似文献   

3.
XML的函数依赖   总被引:7,自引:0,他引:7  
通过分析函数依赖的表现形式在XML文档和关系数据库中的不同之处,提出了基于DTD中的路径表达式的XML函数依赖的概念.它不仅能表达元素的属性和元素的值之间的函数依赖,而且也能表达元素之间的函数依赖.给出了关于XML函数依赖的一组推理规则集.  相似文献   

4.
函数依赖和规范化在关系和XML间的传播   总被引:16,自引:0,他引:16       下载免费PDF全文
谈子敬  施伯乐 《软件学报》2005,16(4):533-539
XML和关系的结合是一个重要的研究领域,讨论函数依赖和规范化在关系及XML间的传播问题.首先引入XML上函数依赖和键的定义,并进一步定义XML上的数据冗余和规范化DTD的概念.分别讨论在关系和XML相互转化的过程中,函数依赖的传播问题.针对一种一般化的关系模式DTD表示,证明原有关系中的函数依赖可以在生成的XML文档上得到表示.针对一种常见的XML关系存储方法,说明最终生成关系上的函数依赖与原有XML上函数依赖的对应关系.函数依赖传播的核心意义在于规范化的传播.证明使用上述方法时,若原有的关系是满足BCNF的,则发布得到的DTD也是规范化的;若原始的DTD是规范化的,则得到的关系存储也满足BCNF范式.  相似文献   

5.
XML文档及其函数依赖到关系的映射   总被引:16,自引:2,他引:16  
有许多文章提出了根据DTD将XML映射成关系的方法,但都没有考虑XML的语义,而语义信息对数据存储模式设计、查询优化、更新异常检查等来说是十分重要的,如果在DTD上指定了XML的函数依赖,在映射到关系数据库中就需要将其考虑进去.基于Hybrid Inlining方法并考虑XML函数依赖,提出了一种既能保持XML文档的内容和结构信息,又能保持函数依赖信息的映射方法.通过这种方法可以减少存储冗余,同时证明了映射后的关系都满足第三范式.  相似文献   

6.
沈刚  罗军 《计算机工程》2009,35(12):56-58
XML保持语义下的冗余检测问题对于防止XML文档的更新异常和减少XML冗余信息的存储具有很大意义,是XML规范化理论的关键问题之一。对XML schema、树元组、XML键、XML范式等进行研究,定义基于schema的XML函数依赖形式化模型,并基于该定义模型设计一种新的XAP算法,可有效发现XML文档中的函数依赖和冗余,并对算法的复杂性进行分析。  相似文献   

7.
为了消除数据冗余,基于关系数据模型的函数依赖理论已经被广泛接受并应用于关系数据库的设计中。XML数据库中同样存在数据冗余。为了设计没有冗余的XML数据库,需要用一种简洁、易于理解的方法来定义XML数据问依赖关系。在无序的结点标记树数据模型上定义了XML子树间的函数依赖,并且给出了一套公理系统用来推导函数依赖,以解决函数依赖的蕴涵问题,最后证明了该公理系统是合理的。  相似文献   

8.
《计算机科学与探索》2016,(8):1080-1091
可扩展标记语言(extensible markup language,XML)已经成为Web上数据表达和数据交换的事实标准,Hadoop已成为云计算和大数据处理典型支撑框架之一,基于Hadoop MapReduce来实现XML查询处理十分必要。为了实现基于MapReduce的XML查询处理,首先实现了区间编码、前缀编码和层次编码等3种不同的XML数据编码方式,以此为基础来研究和实现基于MapReduce的XML结构连接处理。为查询处理建立了代价模型,通过代价估算获得优化的查询计划树。最后开展了XML查询处理实验评估,结果表明相对其他两种XML编码方式,区间编码方式下实现的查询处理速度较快,基于代价估算的优化方法能进一步有效地提高XML查询处理性能。  相似文献   

9.
XML数据中的不正确数据、不一致数据、不精确数据等劣质数据给XML数据上的有效查询处理带来了挑战。重点研究了标签劣质的XML数据上twig查询的处理方法。给出求得每个标签的拼写相近标签、松弛标签、同义标签等相似标签的方法,以及在XML文档中求出与原查询相似的所有查询结果的高效算法。通过实验证明了所提方法的有效性和效率。  相似文献   

10.
为了刻画和处理不确定XML数据,利用粒计算方法研究粗糙XML树信息系统中粗糙XML函数依赖的判定问题。基于粗糙集给出粗糙XML树信息系统的上近似、下近似的定义,借助粗糙相似关系进一步给出粗糙XML函数依赖;分析如何利用位模式表示粗糙XML树信息系统中的信息值;提出粗糙XML树信息系统中路径间的依赖关系的判定算法,并对算法的时间复杂性进行了分析。实例分析表明,信息值采用位模式时,数据格式更接近机器的内部表示,该方法可以快速判定粗糙XML函数依赖,算法的运算效率与速度也得到了提高。  相似文献   

11.
基于Rough Set理论发现最小归纳依赖关系的方法研究   总被引:4,自引:0,他引:4  
程岩  黄梯云 《计算机工程》2000,26(3):26-27,48
归纳依赖关系是数据库研究领域的重要概念,在数据库中自动发现最小归纳依赖关系对数据采掘具有重大意义。介绍了归纳依赖关系的概念、原理及利用Rough Set理论度量数据属性间归纳依赖强度的方法,提出了一个在数据库中自动发现最小归纳依赖关系的算法。  相似文献   

12.
通过分析DTD和XML Schema两种模式的不同之处,参考基于DTD的XML函数依赖的相关研究,提出XML Schema形式化定义和XML的轴元素定义,给出基于XML Schema标准的XML函数依赖定义以及它的推理规则集,有助于规范化XML文档。  相似文献   

13.
殷丽凤  邓武 《计算机科学》2015,42(10):271-274
随着XML成为网络信息表示和交换的标准以及不确定数据的广泛存在,不确定XML数据库管理技术成为了当今研究的热点。首先,允许XML文档叶子节点的信息值为丢失的或遗漏的空值,提出不完备的XML信息系统;其次,提出节点的相容关系、限制相容关系以及阈值相容关系等概念,基于粗糙集理论分别定义这3种关系对应的粗糙集模型;最后,通过实例分析表明,限制相容关系模型能克服相容关系模型分类粗糙的缺点,阈值相容关系模型通过合理地设置阈值可达到更好的分类效果,从而提高了对XML数据的预测、分类的精确度。  相似文献   

14.
研究海洋参数数据检测评价融合问题。在海洋环境监测系统中,由于监测项目繁多,测量数据存在着大量的冗余,使海洋环境的监测准确性差。传统的数据融合算法复杂度较高,难以实时利用,为了消除数据冗余性,针对钦州湾海洋数据的特点,提出了一种粗糙集的属性约简改进算法。结合贪心算法和遗传算法,在编码、交叉、变异、选择方面做了改进,能生成属性个数较少的约简,提高算法效率。通过钦州湾海洋数据融合实例,提出的算法可有效挖掘钦州湾海洋数据间的关联性,通过实验,结果表明了算法的有效性,为海洋环境监测及后续处理提供有力的决策依据。  相似文献   

15.
XML强函数依赖的推理规则   总被引:3,自引:2,他引:3  
当XML文档出现不完全信息时,XML函数依赖同样对于XML文档的键、规范化和完整性约束的研究具有重要意义.本文引入不完全信息环境下XML模式树概念对XML强函数依赖进行了形式化定义;研究了XML强函数依赖的判定条件;给出了XML强函数依赖推理规则,并对推理规则的有效性和完备性进行了证明.  相似文献   

16.
一种基于粗糙集的聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对传统聚类算法受数据空间分布影响大且效率较低的问题,提出一种应用粗糙集理论的聚类算法。以信息表中条件属性与决策属性的一致性原理为基础,以数据超立方体、信息熵实现数据属性约简和离散化。在此基础上,利用集合特征向量加法法则运算,只需扫描一次信息表就可实现对数据对象的聚类划分。实验结果表明该算法是有效可行的。  相似文献   

17.
张永  杨志勇 《计算机工程》2006,32(20):84-85
用户浏览模式获取是现阶段Web日志挖掘的主要目标之一。该文根据用户浏览的重要特征,提出了一种应用粗糙集理论获取规则的方法。选取重要特征作为条件属性并通过算法实现获取最终规则,实例分析效果良好。该方法的特点是只需要简单的数据预处理但可以获得简洁有效的访问模式。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号