共查询到15条相似文献,搜索用时 109 毫秒
1.
文章分析了HTML和XML的特点、论述了HTML向XML转换的必要性、介绍了转换的有关原理,采用了基于把HTML文档解析为DOM树形成节点信息,然后进行深度遍历的方法对各节点信息进行抽取映射为XML结构的信息,以达到转换为XML文档的目的。 相似文献
2.
随着Internet的发展,以HTML格式显示的Web数据越来越不适应新的发展需求,而用来描述和存储数据的XML语言有着许多优于HTML的技术,于是将HTML格式的数据用XML格式表示出来,是现在网络应用中需要解决的问题。这里介绍的基于Web的HTML到XML数据转换方法能够有效地把HTML格式的文件转换成XML(XHTML)格式的文件。 相似文献
3.
4.
5.
6.
7.
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的方法来检索或提取隐藏其中的数据.针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题. 相似文献
8.
针对本地存储结构化数据的XML文档,设计出一个基于DOM树、使用C++实现的轻量级文档解析库.该解析库具有系统资源消耗小、可移植性强的特点,可以方便地与其他C++程序进行衔接. 相似文献
9.
基于DOM的XML数据访问技术 总被引:1,自引:0,他引:1
王建 《计算机与数字工程》2008,36(2):65-67
分析文档对象模型(DOM)的特点,及DOM解析XML文档的方法和主要的接口,并应用此方法在Microsoft的.NET平台下实现XML的数据访问.对推广应用XML和DOM技术有一定的实用意义. 相似文献
10.
首先探讨了利用XML文件存储树型结构数据的直观表示方式。在此基础上用Java编程实现了解析XML文件生成DOM树的方法,最终通过深度优先遍历算法将DOM树转换成JTree树。从而实现了用JTree树直观地显示DOM树,为树型结构数据的图形化表示提供了便利。 相似文献
11.
12.
13.
一种基于多叉树的HTML到XML的转换方法 总被引:4,自引:0,他引:4
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的方法来检索或提取隐藏其中的数据,针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题。 相似文献
14.
一种基于内容的HTML到XML转换策略 总被引:6,自引:0,他引:6
互联网应用系统中传统HTML内容数据的重用及其与Web中标准XML格式数据的互交换非常重要。通过对HTML结构和语法特点的分析,文章定义了一种分离HTML格式信息与表达有效语义的内容数据的标记规则,建立了该标记规则到XML模式的一种影射,从而实现了一种从HTML内容到XML结构数据的转换策略。最后,在网页在线维护系统WOMS中应用该策略实现网站管理者对网页的在线维护。 相似文献
15.
基于HTML和XML的信息提取方法研究 总被引:2,自引:0,他引:2
Web作为巨大的数据源,从Web中提取知识是当前信息研究的热点之一。主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息,并成为将来进行Web挖掘的基础。 相似文献