首页 | 本学科首页   官方微博 | 高级检索  
     

基于标记二叉树的XML数据模式提取算法
引用本文:雷庆,熊汉琛. 基于标记二叉树的XML数据模式提取算法[J]. 计算机工程与设计, 2009, 30(13)
作者姓名:雷庆  熊汉琛
作者单位:华侨大学,计算机科学与技术学院,福建,泉州,362021;华侨大学,计算机科学与技术学院,福建,泉州,362021
基金项目:华侨大学科研基金项目 
摘    要:以XML作为研究对象,提出了一种新的基于二叉树结构的XML数据模式信息的提取方法,抽取出XML文档的所有开始和结束标记并生成相应的标记链,对标记链中结点嵌套关系进行分析生成标记二叉树,通过判断和删除标记二叉树中的冗余数据得到XML文档的最简标记树模式.实验结果表明,即使对于标记的嵌套关系非常复杂的XML文档,该算法也能够准确地抽取出相应的最简标记树模式结构,同时还生成了相应的DTD模式文件.

关 键 词:XML  嵌套关系  标记二叉树  模式抽取  DTD

New binary-tree-based algorithm for XML data model extraction
LEI Qing,XIONG Han-chen. New binary-tree-based algorithm for XML data model extraction[J]. Computer Engineering and Design, 2009, 30(13)
Authors:LEI Qing  XIONG Han-chen
Abstract:
Keywords:XML  DTD
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号