首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
XML已成为网上数据交换和存储的标准,然而现有的XML文档模型存在很多问题.综合了数据挖掘和信息检索两方面的技术,对传统的向量空间模型加以扩展,提出一种新的基于语义和支持度的XML向量空间模型并给出其生成算法,该模型抽取文档集的频繁路径作为特征,然后利用XML本身的语义特性,对标签之间作ontology判断.最后,基于该模型提出一种XML近似查询算法,将文档矩阵从改进的VSM空间映射到潜在语义空间,并在转换后的空间获得近似查询结果并排序.对提出的方法进行理论分析和实验验证,得到满意的结果.  相似文献   

2.
基于XML的界面自动生成*   总被引:3,自引:0,他引:3  
为了满足重用性和自动化的需要,从支持用户界面自动生成的FMP模型出发,提出了用XML文档保存所有模型信息的方法以及相应的转换算法;并在此基础上详细介绍了界面生成引擎的设计以及相应的代码生成算法。  相似文献   

3.
基于核矩阵学习的XML文档相似度量方法   总被引:6,自引:0,他引:6  
杨建武  陈晓鸥 《软件学报》2006,17(5):991-1000
XML文档作为一种新的数据形式,成为当前的研究热点.XML文档间相似度的计算是XML文档分析、管理及文本挖掘的基础.结构链接向量模型(structuredlink vector model,简称SLVM)是一种综合考虑XML文档结构信息与内容信息进行XML文档相似度量的方法.体现XML文档结构单元关系的核矩阵在结构链接向量模型中扮演着重要角色.为自动捕获XML文档结构单元关系,提出了两种核矩阵的学习算法,分别是基于支持向量机(support vector machine,简称SVM)的回归学习算法和基于矩阵迭代的学习算法.相似搜索实验对比结果表明,基于核矩阵学习方法的XML文档相似度量方法的准确性明显优于其他方法.进一步实验表明,基于矩阵迭代学习的核矩阵学习算法与基于支持向量机的回归学习算法相比,不仅具有更高的准确性,而且所需训练文档更少、计算代价更小.  相似文献   

4.
面向对象XML的存储模式的研究   总被引:1,自引:1,他引:0  
面向对象XML包括两个组成部分:扩展模式文档和XML,利用解析后的扩展模式文档分析XML进行数据分析,以支持扩展XML-RL查询方式.文中设计了两种模式语言的解析方式和面向对象XML的两种存储模型,为集中式和分布式,并通过实验对比两种存储模型的性能,分析了各自的优缺点,同时得到使用扩展XML Schema比Extended DTD更为有效的结论.  相似文献   

5.
基于XPath数据模型的双时态扩展   总被引:1,自引:0,他引:1  
XML作为Web上新的数据发布语言,将成为Web下一代"数据表达"和"数据交换"的统一标准.然而XML文档很少是静止的,它经常会被修改,引入"时态表达"后时态XML文档能够记录一系列的修改痕迹,提供了一种高效可行的XML版本管理方案.另一方面XML表达时态信息比关系模型更自然,时态数据库的研究人员开始将部分焦点转向研究如何利用XML实现时态信息处理.提出了一个双时态XML数据模型并给出了形式化定义,该模型将一个双时态XML文档建模成一个带有"双时态元素"边标记的有向树形图.还讨论了该模型映射到双时态XML文档的两种映射方法;并采用扩展DOM API的方法实现了模型以及映射.最后通过实验对比了扩展DOM实现模型和不扩展DOM实现模型两种实现方法,两种模型映射到双时态XML文档的映射方法.  相似文献   

6.
首先介绍了异构交换网络拓扑结构中星形树结构相对于其他结构的优势,接着分析比较了基于模板驱动和基于模型驱动的XML与关系数据库映射方法,然后介绍了JMS技术实现XML文档传输的特点以及星形树网络中文档的路由算法。基于以上分析,最后采用扩展的基于模型驱动算法设计实现了一个电子政务数据交换原型系统。  相似文献   

7.
宁静  刘杰  叶丹 《计算机科学》2010,37(6):179-185
使用XML Schema能够对XML文档进行有效性验证以及对查询、转换等操作进行优化,但是实际应用中大量XML文档缺失关联的Schema.提出了一种根据XML文档自动提取对应的XML Schema Definition(XSD)的方法XSDInfer,先根据合并规则将XML解析过程中分析得到的模式信息记录在内容模型图中,再根据生成规则将其转化为内容模型表达式,进而得到XSD.XSDInfer能够在内存消耗比较少的情况下快速地处理超大规模、深度嵌套的XML文档,同时支持XSD的上下文相关的内容模型,提取出的XSD也具有更好的可读性.实验表明,与同类方法相比,XSDInfer具有更好的可扩展性和表达能力.  相似文献   

8.
基于核方法的XML文档自动分类   总被引:3,自引:0,他引:3  
杨建武 《计算机学报》2011,34(2):353-359
支持向量机(SVM)方法通过核函数进行空间映射并构造最优分类超平面解决分类器的构造问题,该方法在文本自动分类应用中具有明显优势.XML 文档是文本内容信息与结构信息的综合体,作为一种新的数据形式,成为当前的研究热点.文中以结构链接向量模型为基础,研究了基于支持向量机的XML文档自动分类方法,提出了适合XML文档分类的核...  相似文献   

9.
基于DOM解析器的XML编辑器研究   总被引:1,自引:1,他引:0  
戴蓓洁  余双  金蓓弘 《计算机工程与设计》2007,28(22):5334-5337,5358
DOM是一种独立于语言和平台的XML解析模型.给出了支持DOM核心模型和多种DOM扩展规范的XML编辑器ONCEXMLEditor的实现.ONCEXMLEditor具有高效的XML验证和序列化性能,同时提供给用户多种功能,包括按需遍历文档、提供上下文感知的编写环境、实时纠错、灵活的装载和序列化机制等.描述了ONCEXMLEditor的体系结构及其实现核心算法,同时给出了XML文档有效性验证和装载及序列化的性能优化策略.  相似文献   

10.
基于扩展Dewey编码的XML文档更新计算   总被引:1,自引:0,他引:1  
针对在进行XML文档插入、删除等更新时因需要频繁调整相应的子树编码而导致更新低效问题.分析了低效的原因,提出了一种扩展的Dewey编码方案.该编码方案对Dewey编码的连续性进行扩展,使兄弟节点之间的编码不再连续,为插入新节点准备冗余空间.在此基础上,设计了支持该扩展编码方案的XML文档节点插入算法和分裂算法.实验结果表明,提出的扩展Dewey编码方案有效地实现了XML文档的更新计算.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号