首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 484 毫秒
1.
“可扩展标记语言”(XML)是一种简单的与平台无关并被广泛采用的结构化化语言标准。XML相对于HTML的优点是它将用户界面与结构化数据分隔开来,XML不是要替换HTML,实际上XML可以视作对HTML的补充。以下从两个方面浅谈XML与HTML的结合。  相似文献   

2.
一种新的Web数据模型-EOEM   总被引:1,自引:0,他引:1  
随着XML的普及,开发具有同时查询XML文档和HTML文档能力的新一代Web查询语言已是当务之急.但现有的Web数据模型存在种种局限.本文提出了一种新的Web数据模型,能够同时支持HTML和XML等半结构化文档的查询.  相似文献   

3.
正象HTML一样,可扩展标记语言XML(Extensible Markup Language)也是一种标记语言。它是互联网上结构化的文件交换的一种数据模式,因而成为网上传送结构化数据的工具,它同样依赖于描述一定规则的标签和能够读懂这些标签的应用处理工具来发挥它的强大功能。这一点,从XML的命名上也可窥见一斑。 XML的强大功能主要来自于其可扩展性。业界观察家认为XML将使信息交换方式发生变革,就象HTML改变了用户界面一样。但XML并非象HTML那样,提供一组事先已经定义好的标签,而是提供一种标准,利用这个标准,用户可以根据实际需要定义自己的新的标记语言,并为该自定义的标记语言规定其特有的一套标签,如XML允许开发人员为价格、产品等数据创建他们自己的标记,这样的结果是获得更加有效的数据交换和更好的Internet搜索能力。  相似文献   

4.
本文提出了一种Web查询语言WebQL,能同时处理XML和HTML文档资源,实现了结构化查询,提高了查询的准确度和速度,并给出了用VC 实现的WebQL原型系统.  相似文献   

5.
吕锋  余丽 《微机发展》2007,17(6):53-55
文中介绍了三种常用的Web数据抽取的方法:直接解析HTML文档的方法,基于XML的方法(也称作为分析HTML层次结构的方法)以及基于概念建模的方法。重点研究其中的基于XML的数据抽取方法,基本做法是将原始的HTML文档通过一个过滤器检查并修改HTML文档的语法结构,从而形成一篇基于XML的XHTML,然后利用XML工具来处理这些HTML文档。实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程,给在Web挖掘中使用传统的数据抽取方法进行数据抽取创造了有利条件。  相似文献   

6.
基于XML的Web数据抽取研究   总被引:1,自引:0,他引:1  
文中介绍了三种常用的Web数据抽取的方法:直接解析HTML文档的方法,基于XML的方法(也称作为分析HTML层次结构的方法)以及基于概念建模的方法。重点研究其中的基于XML的数据抽取方法,基本做法是将原始的HTML文档通过一个过滤器检查并修改HTML文档的语法结构,从而形成一篇基于XML的XHTML,然后利用XML工具来处理这些HTML文档。实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程,给在Web挖掘中使用传统的数据抽取方法进行数据抽取创造了有利条件。  相似文献   

7.
陈能技 《电脑爱好者》2002,(18):106-107
一、XML简介 XML在问世的时候就被赋予电子商务世界语的美称,原因在于XML不仅简单,而且还是结构化的ASCⅡ文本语言,任何人都能读懂它。与HTML语言需要预先定义语法集不同,XML文件虽然要遵循通用的语法规则,但真正的关键词则是由作者决定的。其含义可由DTD文件或者Schema来定义。使用DTD或Schema的XML文件可以说是一个自我解释的文件,在数据集成化和出错调整时都很有用。XML的结构化模式使得数据和信息可以在应用程序之间相互传递,包括在多层应用的中间层之间。它提供一个标  相似文献   

8.
目前有数以百万人在使用 HTML 语言,但在未来 Web 可能会由 W3C 的 XML(扩展标记语言)语言来书写,XML 使 Web 更好的适应了不同人员的数据信息要求,允许内容创建者使用结构化的数据来描述内容,非常易于处理,而且可以方便的传输到不同用户的设备上。讨论 XHTML 1.0标准的时候,W3C 的 HTML 工作组面临着许多挑  相似文献   

9.
跨进XML时代     
如果说HTML是互联网络的第一次革命,那么XML则给网络的各种应用带来了第二次历史性的变化,也创造出更多的新型应用机会。XML有利于信息的表达和结构化组织,从而使数据搜索更有效:XML可以使用URL别名使Web的维护更方便,也使Web的应用更稳定;XML可以使用数字签名使Web的应用更广阔拓展到安全保密领域。可以认为来来的Web书写工具必定是XML。 XML代表扩展标识语言(Extensible Markup Language),它是一个精简的SGML(Standard Generalized Markup Language,标准通用标记语言),将SGML的丰富功能与HTML的易用性结  相似文献   

10.
基于XML的web文本挖掘方法与模型研究   总被引:2,自引:2,他引:0  
Internet的快速发展和大量非结构化数据的出现,给传统的数据挖掘工具带来了极大的挑战。XML(可扩展标记语言)技术一方面继承了HTML的灵活性和简单性,另一方面又具有强制结构的完整性和标签的自定义性,已经成为web挖掘的一个重要方向。本文在介绍XML语言基本特点的基础上,针对web上大量异构数据的特点,探讨了基于多叉树的HTML到XML的转换方法,实现web上文本的规范化,并将其用于提出的基于XML的web文本挖掘模型,提高web文本挖掘的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号