首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 109 毫秒
1.
文章分析了HTML和XML的特点、论述了HTML向XML转换的必要性、介绍了转换的有关原理,采用了基于把HTML文档解析为DOM树形成节点信息,然后进行深度遍历的方法对各节点信息进行抽取映射为XML结构的信息,以达到转换为XML文档的目的。  相似文献   

2.
随着Internet的发展,以HTML格式显示的Web数据越来越不适应新的发展需求,而用来描述和存储数据的XML语言有着许多优于HTML的技术,于是将HTML格式的数据用XML格式表示出来,是现在网络应用中需要解决的问题。这里介绍的基于Web的HTML到XML数据转换方法能够有效地把HTML格式的文件转换成XML(XHTML)格式的文件。  相似文献   

3.
文章研究了XML文档转换为富文本格式的方法,提出了一种基于XSL将XML文档转换HTML格式文档的算法.首先,新建一个与XML文档同名的HTML格式文档;其次定义转换算法,实现XML文档到HTML格式文档的转换;最后,调用系统默认浏览器以查看转换得到的HTML文档.该算法可以基于XSL将XML文档转换为HTML格式文档,以查看和验证XML文档的富文本显示格式是否符合阅读要求.  相似文献   

4.
基于文档树的XML文件转换   总被引:1,自引:0,他引:1  
随着互联网与XML技术的不断发展,实现XML文件与非结构化的文本文件之间的相互转换的要求日趋提高,针对该问题,文章提出了一种基于文档树的XML文件转换方法。该方法通过文档树的形式描述文本文件的结构与内容,在特定的映射规则下对文档树进行遍历以实现RTF文件为代表的文本文件与XML文件的相互转换,最后介绍了文档树的构造及相关算法.  相似文献   

5.
从XML文档的基本结构出发,详细论述了DOM(Document Object Model,文档对象模型)构造、节点树结构特征及DOM的基本接口,结合XML与数据库的存储与转换技术,论证了DOM在XML数据库操作中的重要性。  相似文献   

6.
利用XML DOM创建强大的XML应用   总被引:10,自引:1,他引:10  
介绍了DOM产生的背景和DOM规范,并讨论了利用XML DOM技术来实现动态地创建文档,以及遍历文档结构、添加、修改、删除文档内容,改变文档的显示方式等方法,最后给出了制作XML网页应用的实例和步骤。  相似文献   

7.
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的方法来检索或提取隐藏其中的数据.针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题.  相似文献   

8.
针对本地存储结构化数据的XML文档,设计出一个基于DOM树、使用C++实现的轻量级文档解析库.该解析库具有系统资源消耗小、可移植性强的特点,可以方便地与其他C++程序进行衔接.  相似文献   

9.
基于DOM的XML数据访问技术   总被引:1,自引:0,他引:1  
分析文档对象模型(DOM)的特点,及DOM解析XML文档的方法和主要的接口,并应用此方法在Microsoft的.NET平台下实现XML的数据访问.对推广应用XML和DOM技术有一定的实用意义.  相似文献   

10.
首先探讨了利用XML文件存储树型结构数据的直观表示方式。在此基础上用Java编程实现了解析XML文件生成DOM树的方法,最终通过深度优先遍历算法将DOM树转换成JTree树。从而实现了用JTree树直观地显示DOM树,为树型结构数据的图形化表示提供了便利。  相似文献   

11.
基于链式结构XML文档的生成方法   总被引:4,自引:0,他引:4  
提出了一种基于链式结构的XML文档生成方法,设计了一个利用Java中的stream tokenizer类实现HTML文档解析的算法,将解析得到的元素内容及文本内容生成的结点插入到相应的位置上,同步生成DOM解析树,对DOM解析树进行遍历,将遍历得到的信息以二叉链表的形式存储,采用改进的先根遍历算法对该二叉链表遍历,提取相应的信息构建DTD,完成整个转换生成的过程。  相似文献   

12.
基于DOM树和递归X—Y分割算法的Zone树模型   总被引:2,自引:2,他引:0       下载免费PDF全文
黄歆  桑楠 《计算机工程》2009,35(5):53-55
在分析DOM树的基础上提出一种基于DOM树和递归X—Y分割算法,可以根据网页的几何布局生成Zone树模型。描述了将Zone树模型和递归X—Y算法应用到文献数据检索的优越性,给出构建Zone树模型的算法。该模型主要用于在线文献的数据提取,具有速度快、准确性高等特点,优于目前大多数浏览器所采用的DOM树结构。  相似文献   

13.
一种基于多叉树的HTML到XML的转换方法   总被引:4,自引:0,他引:4  
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的方法来检索或提取隐藏其中的数据,针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题。  相似文献   

14.
一种基于内容的HTML到XML转换策略   总被引:6,自引:0,他引:6  
互联网应用系统中传统HTML内容数据的重用及其与Web中标准XML格式数据的互交换非常重要。通过对HTML结构和语法特点的分析,文章定义了一种分离HTML格式信息与表达有效语义的内容数据的标记规则,建立了该标记规则到XML模式的一种影射,从而实现了一种从HTML内容到XML结构数据的转换策略。最后,在网页在线维护系统WOMS中应用该策略实现网站管理者对网页的在线维护。  相似文献   

15.
基于HTML和XML的信息提取方法研究   总被引:2,自引:0,他引:2  
陈红叶 《微机发展》2003,13(Z2):54-55
Web作为巨大的数据源,从Web中提取知识是当前信息研究的热点之一。主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息,并成为将来进行Web挖掘的基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号