首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
本文提出了一种Web查询语言WebQL,能同时处理XML和HTML文档资源,实现了结构化查询,提高了查询的准确度和速度,并给出了用VC 实现的WebQL原型系统.  相似文献   

2.
一种面向XML表达的WEB数据模型   总被引:9,自引:0,他引:9  
XML作为新一代的Web信息表达语言,其强大数据描述和传递能力使得传递的Web数据模型无法满足,在比较OEM模型的基础上提出了一种新的面向XML表达的数据模型XOEM模型及其对象代数,同时根据XML文档特点提出层次分形-多级超链的基元,以保证XML文档一致有效性和合法性,最后给出XOEM模型应用在XML文档中的实例。  相似文献   

3.
利用约束优化数据库Web视图上的查询   总被引:1,自引:0,他引:1  
当前,许多大的Web站点的信息和数据呈现出结构化或半结构化的特点,因而可经抽象,作为类似关系数据库或者面向对象数据库并加以处理,以提高操作效率,特别是在此基础上进行的查询操作.但查询这些抽象的结构化或半结构化的视图需要新的技术.由于数据存储比较分散,并且多数以HTML,XML等的形式存放,因而网络访问成为主要的查询代价构成要素.为此通过利用’Web数据库的冗余来减少网络访问.采用数据模型Araneus的一个子集作为数据模型,并利用链接约束、包含约束、范围约束以及多种规则重写关系代数表达式,以期达到优化查询结果的目的。  相似文献   

4.
XML是随Web发展所得到的必然产物。它已成为当前网络应用(包括数字图书馆、网络编程、Web服务等)中事实上的数据表达、交换的标准。XML查询已经有了很好的技术基础,但由于XML数据它自身所特有的特点,以及和传统数据模型的差别,XML查询在理论上和实现上都还存在很多难点。本文主要为实现XML文档查询系统XQuery探讨了XML查询的各种处理对象。  相似文献   

5.
从数据模型的角度分析了现有XML查询方法存在缺陷的原因,并提出了一种新颖的自导航式XML查询方案.查询方案先对XML数据模型进行了改进,构造了与数据模型相匹配的查询语言和查询算法.其中,数据模型依据XML文档中节点间的语义相关性对节点信息进行聚簇式存储;查询语言则利用简单语法表达复杂语义;查询算法则具备自导航能力,能帮助用户在不完全了解XML文档结构的情况下获得目标信息.  相似文献   

6.
集成Web 数据的系统框架与实现方法   总被引:5,自引:0,他引:5  
基于我们正在研究和开发的项目Panorama,本文提出了一个基于XML和CORBA的Web数据集成系统框架,该框架可以集成来自Web上多个异构的数据源,包括关系数据库、面向对象数据库,HTML和XML文档及结构化文本文件。在系统实现中,把Web看作是一个巨大的虚拟数据库,以CORBA作为分布式对象模型,以XML作为公共誓据模型,并且以XML-QL作为全局查询语言来完成Web上的数据查询和集成。文中还详细分析和描述了系统框架中的一些主要模块的实现方法,具有很好的可操作性。  相似文献   

7.
XWIS中基于预定义模式的包装器   总被引:3,自引:0,他引:3  
目前,从HTML文档中有效的抽取数据是一个值得研究的问题。文中提出了一种基于预定义模式的方法来构造HTML包装器,并将它运用到XWIS(基于XML的Web信息查询系统)中。这种方法下,由用户定义模式并给出模式与HTML页面的映射关系,接着系统推导出规则同时生成包装器。  相似文献   

8.
吕锋  余丽 《微机发展》2007,17(6):53-55
文中介绍了三种常用的Web数据抽取的方法:直接解析HTML文档的方法,基于XML的方法(也称作为分析HTML层次结构的方法)以及基于概念建模的方法。重点研究其中的基于XML的数据抽取方法,基本做法是将原始的HTML文档通过一个过滤器检查并修改HTML文档的语法结构,从而形成一篇基于XML的XHTML,然后利用XML工具来处理这些HTML文档。实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程,给在Web挖掘中使用传统的数据抽取方法进行数据抽取创造了有利条件。  相似文献   

9.
基于XML数据模型的Web数据库查询系统   总被引:4,自引:1,他引:4  
文中提出用XML作为统一的数据模型的Web数据库的概念和体系结构,设计并实现了基于XML的Web数据库上的查询,提出并实现了用Web索引机制实现快速、高效的Web查询。  相似文献   

10.
基于XML的Web数据抽取研究   总被引:1,自引:0,他引:1  
文中介绍了三种常用的Web数据抽取的方法:直接解析HTML文档的方法,基于XML的方法(也称作为分析HTML层次结构的方法)以及基于概念建模的方法。重点研究其中的基于XML的数据抽取方法,基本做法是将原始的HTML文档通过一个过滤器检查并修改HTML文档的语法结构,从而形成一篇基于XML的XHTML,然后利用XML工具来处理这些HTML文档。实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程,给在Web挖掘中使用传统的数据抽取方法进行数据抽取创造了有利条件。  相似文献   

11.
随着Internet的发展,以HTML格式显示的Web数据越来越不适应新的发展需求,而用来描述和存储数据的XML语言有着许多优于HTML的技术,于是将HTML格式的数据用XML格式表示出来,是现在网络应用中需要解决的问题。这里介绍的基于Web的HTML到XML数据转换方法能够有效地把HTML格式的文件转换成XML(XHTML)格式的文件。  相似文献   

12.
基于Nutch的XML网站全文搜索引擎实现   总被引:2,自引:0,他引:2       下载免费PDF全文
吴敏琦  丁岳伟 《计算机工程》2008,34(15):95-96,1
普通搜索引擎的网页抓取程序只能理解常见HTML标签,无法对XML网站的内容做有效解析。该文建立一个包含动态自定义标签的纯XML网站,提出借助XSL样式信息帮助网页抓取程序理解XML网页标签含义的方案,实现了基于Nutch的XML网站全文搜索引擎。  相似文献   

13.
基于XML的中间层交互技术的研究   总被引:1,自引:0,他引:1  
陆剑江 《微机发展》2004,14(8):30-33
由于HTML自身的不足.所以无法适应Web发展的复杂性和多变性,也不利于机器之间的数据交换和信息传递,通过对XML和HTML作多个角度的对比,文中提出将XML作为载体实现Web上的动态交互。首先从XML的自身特点出发,分析了XML驱动下的Web体系结构,从而得出基于XML的中间层交互技术的实现原理.重点研究了如何设计与XML相匹配的Web数据库,用XML查询数据库的实现方法,以及如何构造从XML到数据库的映射关系,具体包括从XIviL的DTD或者Schema出发来设计数据库的结构或者从数据库本身出发来构造与之相适应的DTD或Schema,最后分析了浏览XML格式信息的诸多策略。  相似文献   

14.
丁崧  黄上腾 《计算机工程》2000,26(9):166-167
探讨了新一代Web的基础XML的体系结构及特点,并对XML与HTML进行比较。提出了一个基于XM斩HIS系统设计框架。  相似文献   

15.
《Computer》1998,31(10):120-122
Called “the emerging technology of the year” after it was endorsed by the World Wide Web Consortium (W3C), XML burst onto the scene in February. It was called the successor to HTML and, according to some, the future lingua franca for the exchange of structured data. As XML emerged from the obscurity of its W3C beginnings, it was perhaps inevitable that this new data format would begin generating misconceptions as fast as it has attracted enthusiasts. The article heads off four myths about XML before they become permanent misunderstandings: XML is a conspiracy led by Microsoft; XML is an extension of HTML; XML can drive Web browsers by itself; and XML is just for data  相似文献   

16.
目前W3C推荐的网页格式标准是XML1.0[1],但要求为数众多的已有站点直接采用XML还为时过早。因此,用XML对HTML进行扩展,得到了XHTML。但多数Web开发人员仍习惯用HTML语法写XHTML网页,导致代码不被识别或显示效果不佳。通过对比研究XHTML与HTML的细致区别,阐明了XHTML文档的结构特征及独特的语法要求,目的在于帮助Web开发人员适应这种技术的变化,顺利地完成Web开发任务。  相似文献   

17.
Since the Web encourages hypertext and hypermedia document authoring (e.g., HTML or XML), Web authors tend to create documents that are composed of multiple pages connected with hyperlinks. A Web document may be authored in multiple ways, such as: (1) all information in one physical page, or (2) a main page and the related information in separate linked pages. Existing Web search engines, however, return only physical pages containing keywords. We introduce the concept of information unit, which can be viewed as a logical Web document consisting of multiple physical pages as one atomic retrieval unit. We present an algorithm to efficiently retrieve information units. Our algorithm can perform progressive query processing. These functionalities are essential for information retrieval on the Web and large XML databases. We also present experimental results on synthetic graphs and real Web data  相似文献   

18.
使用JSP技术生成动态XML管理信息系统的设计与实现   总被引:2,自引:0,他引:2  
XML是Internet上数据表示和交换的标准;JSP是在传统的HTML代码中插入JSP脚本语言(Java语言)的动态页面技术。本文使用XML文件在Web服务器上进行数据存储,并用JSP技术来显示数据,从而完成一个管理信息系统的设计和实现。  相似文献   

19.
HTML was one of the technologies that ushered in the concept of the Web enabled enterprise. XML is driving Web-enablement to new levels as it becomes the de facto middleware standard for bridging legacy systems and the Web. This article is a hands-on, code-filled look at one way to use XML as Web-enabling middleware.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号