首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 62 毫秒
1.
王娟  魏应彬 《现代计算机》2004,(7):79-81,100
JDOM作为一个开放源代码的应用程序接口,简化了Java对XML数据的操作.本文对JDOM进行了简单的介绍,并与其他几种应用程序接口DOM、SAX、JAXB做了比较详细的对比,最后通过实例展示了用JDOM从数据库生成XML文档的过程.  相似文献   

2.
提出了一种基于树及索引结构的HTML解析与表格数据抽取的算法,并对各子算法复杂性进行了讨论,对HTML标签存贮模型及表格数据挖掘模型进行了详细的说明,对算法所涉及的二叉树、栈、容器、递归等算法及数据结构作了清晰阐述。  相似文献   

3.
文章分析了HTML和XML的特点、论述了HTML向XML转换的必要性、介绍了转换的有关原理。采用了基于把HTML文档解析为DOM树形成节点信息,然后进行深度遍历的方法对各节点信息进行抽取映射为XML结构的信息。以达到转换为XML文档的目的。  相似文献   

4.
XML(eXtemible Markup Language)是一种可扩展的元置标语言,XML技术的出现,给互联网带来了无限的商机。可以说,XML已经渗透到Intemet的各个角落。文章分别介绍了两种标记语言:超文本标记语言(HTML)和可扩展标记语言(XMC),并对其作简单的比较分析。  相似文献   

5.
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的方法来检索或提取隐藏其中的数据.针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题.  相似文献   

6.
提出了一种基于树及索引结构的HTML解析与表格数据抽取的算法,并对各子算法复杂性进行了讨论,对HTML标签存贮模型及表格数据挖掘模型进行了详细的说明,对算法所涉及的二叉树、栈、容器、递归等算法及数据结构作了清晰阐述。  相似文献   

7.
XML与HTML整合     
XML与HTML都是重要的网络标识语言,但各自具有优缺点,XML侧重于数据的描述,HTML侧重于数据的显示,若将两者整合则可以取长补短。主要介绍如何使用数据岛技术来实现XML与HTML的整合。  相似文献   

8.
XML与HTML整合     
XML与HTML都是重要的网络标识语言,但各自具有优缺点,XML侧重于数据的描述,HTML侧重于数据的显示,若将两者整合则可以取长补短。主要介绍如何使用数据岛技术来实现XML与HTML的整合。  相似文献   

9.
随着Internet的发展,以HTML格式显示的Web数据越来越不适应新的发展需求,而用来描述和存储数据的XML语言有着许多优于HTML的技术,于是将HTML格式的数据用XML格式表示出来,是现在网络应用中需要解决的问题。这里介绍的基于Web的HTML到XML数据转换方法能够有效地把HTML格式的文件转换成XML(XHTML)格式的文件。  相似文献   

10.
本文主要围绕HTML和XML两种标记语言,通过比较,指出了它们之间的相同和不同之处。虽然均为标记语言,HTML主要长于显示数据项,便于数据信息在Web上的显示;而XML更方便数据信息的存取、处理、交换、转换,适宜不同系统和应用程序之问进行数据交流和整合。  相似文献   

11.
网上表格数据到XML的自动转换   总被引:3,自引:0,他引:3       下载免费PDF全文
互联网上有大量信息采用HTML表格表示,由于HTML不描述数据的内容,机器不能理解和查询。论文利用HTML表格属性,在表格中插入冗余单元,使HTML表格规范化;对没有标志表头的HTML表格,采用格式化的信息的量化值识别网上表格的表头。在此基础上,提出了通过获取表格属性与值对应的语义层次,自动转换HTML表格数据为XML文挡的新方法。  相似文献   

12.
HTML表格向XML的智能转换   总被引:2,自引:0,他引:2       下载免费PDF全文
XML已经成为处理与管理信息的标准格式,而HTML表格被广泛应用于Web。为了充分利用与管理HTML表格信息,需要将HTML表格转换成XML。提出一种有效的处理方法,该方法包含2个部分,即表格识别与结构转换。表格识别通过检查格式、语法及语义的特征将表格提取出来并分割成值域与属性域,使用预设的表格模板分析属性域与值域间的层次结构并将其转换成XML格式。通过 300多个表格的实验表明,所提出的方法要优于传统方法,结果的准确率达86.7%。  相似文献   

13.
一种基于多叉树的HTML到XML的转换方法   总被引:4,自引:0,他引:4  
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的方法来检索或提取隐藏其中的数据,针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题。  相似文献   

14.
XML是一种显示数据的标记语言,它能使数据通过网络无障碍地进行传输,并显示在用户的浏览器上.XML实现了数据与表示的分离,需要通过样式表来显示XML数据.介绍XSLT的特性及功能,通过示例,介绍通过XSLT如何将一个XML文档转换为HTML文档的方法.并说明该方法的用途.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号