共查询到10条相似文献,搜索用时 15 毫秒
1.
在网络中,到目前为止,几乎所有的Web页面都是用HTML语言编写的。但随着Web应用的越来越广泛,HTML的弱点越来越明显,一种替代HTML的Web页面制作语言技术——XML出现了。专家认为:在未来的5年内,XML和HTML将同时用于Eeb应用的开发中,但未来的Web书写工具必定是XML。 相似文献
2.
随着Internet的发展,以HTML格式显示的Web数据越来越不适应新的发展需求,而用来描述和存储数据的XML语言有着许多优于HTML的技术,于是将HTML格式的数据用XML格式表示出来,是现在网络应用中需要解决的问题。这里介绍的基于Web的HTML到XML数据转换方法能够有效地把HTML格式的文件转换成XML(XHTML)格式的文件。 相似文献
3.
《每周电脑报》2000,(36)
如果说HTML是互联网络的第一次革命,那么XML则给网络的各种应用带来了第二次历史性的变化,也创造出更多的新型应用机会。XML有利于信息的表达和结构化组织,从而使数据搜索更有效:XML可以使用URL别名使Web的维护更方便,也使Web的应用更稳定;XML可以使用数字签名使Web的应用更广阔拓展到安全保密领域。可以认为来来的Web书写工具必定是XML。 XML代表扩展标识语言(Extensible Markup Language),它是一个精简的SGML(Standard Generalized Markup Language,标准通用标记语言),将SGML的丰富功能与HTML的易用性结 相似文献
4.
5.
一种基于多叉树的HTML到XML的转换方法 总被引:4,自引:0,他引:4
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的方法来检索或提取隐藏其中的数据,针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题。 相似文献
6.
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的方法来检索或提取隐藏其中的数据.针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题. 相似文献
7.
文中介绍了三种常用的Web数据抽取的方法:直接解析HTML文档的方法,基于XML的方法(也称作为分析HTML层次结构的方法)以及基于概念建模的方法。重点研究其中的基于XML的数据抽取方法,基本做法是将原始的HTML文档通过一个过滤器检查并修改HTML文档的语法结构,从而形成一篇基于XML的XHTML,然后利用XML工具来处理这些HTML文档。实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程,给在Web挖掘中使用传统的数据抽取方法进行数据抽取创造了有利条件。 相似文献
8.
9.
基于XML的Web数据抽取研究 总被引:1,自引:0,他引:1
文中介绍了三种常用的Web数据抽取的方法:直接解析HTML文档的方法,基于XML的方法(也称作为分析HTML层次结构的方法)以及基于概念建模的方法。重点研究其中的基于XML的数据抽取方法,基本做法是将原始的HTML文档通过一个过滤器检查并修改HTML文档的语法结构,从而形成一篇基于XML的XHTML,然后利用XML工具来处理这些HTML文档。实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程,给在Web挖掘中使用传统的数据抽取方法进行数据抽取创造了有利条件。 相似文献
10.
一种基于XML的Web数据挖掘方法 总被引:8,自引:0,他引:8
XML的出现为基于Web的数据挖掘带来了便利,但是目前很多网站都是用HTML构建的,要真正做到高效准确的挖掘数据非常困难.介绍一种方法充分利用XML的优点对HTML描述的网站信息进行挖掘,并结合实例说明了这种方法. 相似文献