首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于XML的智能信息检索与聚类研究   总被引:1,自引:0,他引:1  
目前Web上大多是非结构化的信息,检索主要是通过基于关键词的搜索引擎或目录浏览。近来,许多组织、团体、协会在Web上通过DTD/Schema定义XML(Extensible Markup Language)档,由于XML描述了结构化的信息,对XML文档的检索也与以往的搜索引擎不同。为此,本文设计了一个新的基于XML文档的智能信息检索原型系统XIIRC,给出了它的体系结构及功能,并对用户界面、索引机制、查询机制、检索结果概念聚类等问题进行了探讨。  相似文献   

2.
提出了一种面向HTML或XML描述的Web数据抽取模型,首先用STOCK把Web文档从Web服务器读下来,识别Web文档的表示格式,若是HTML格式,则先把HTML数据转换成XHTML(XML的子集)格式,然后对Web页进行修复后合并形成系列XML文档并存储,采用绝对路径和锚点(Anchor),利用XML数据格式的工具来检索相关数据,获取所需数据并构造XML输出,从而实现Web数据抽取过程。实验表明,该模型实现Web数据抽取是可行的,根据该模型的缺陷,提出了一个基于语义Web技术的信息抽取改进模型。  相似文献   

3.
基于XML的Web数据抽取方法的研究   总被引:1,自引:1,他引:0  
针对Web挖掘中Web数据的抽取问题,设计了一种基于XML的Web数据抽取方法。由于Web数据的最大特点是半结构化,所以采用XML(半结构化的数据模型)来解决传统的关系数据库不适合Web数据存储的问题,从而将XML的档描述与关系数据库中的属性一一对应起来,实施精确地查询与模型抽取。由于Web数据的大量信息都与抽取无关,所以利用XSL过滤掉XML的无关数据,并进行实时抽取,最后将合并结果保存到XML档中。实验结果表明,此方法可以很好地解决Web数据的抽取和存储问题。  相似文献   

4.
基于XML的Web半结构化信息抽取   总被引:1,自引:0,他引:1  
Web信息抽取是信息抽取技术在B/S体系中的新发展,在增量信息存储与搜索中有着广泛的应用。本文阐述的基于XML的Web半结构化信息抽取,是将Web表示层作为信息源,基于XML、JTidy数据清洗及Xquare-bridge等技术及开源项目,实现Web中半结构化的隐式信息点抽取,生成结构化、语义更清晰的表示及存储形式。  相似文献   

5.
为将原始的岩画信息转换为国际化的可持续研究的数字资源,通过对原始资源的分析和对国际流通标准的借鉴,设计了基于DC的岩画中文元数据标准,实现了该标准的RDF/XML描述,并且根据岩画元数据的特点和XML文档的结构化提出信息在关系数据库中的存储方案.研究实现了基于DC标准的岩画图像信息的表示和存储,使岩画信息成为可精确查询的网络流通的信息资源.  相似文献   

6.
针对电子病历的发展现状,提出了基于XML的电子病历系统的设计思想和方法,以及相应的数据结构和体系结构模型,研究并实现了对XML文档的加密方法.在算法设计上采用pure XML技术实现了通过关系型与层次型两种引擎同时进行检索.为电子病历的管理及进一步的研究和利用创造了条件.  相似文献   

7.
XML文档作为一种半结构化数据,与关系数据库中存储的结构化数据存在一定的差异。本文通过分析XMLSchema的结构和语法,借鉴P-Schema的思想,提出了一种名为E-Schema方法用于XML模式到关系模式的映射,解决了多值元素、可选元素、组元素的映射问题,能够在关系数据库中完整的保存XML文档的结构信息和数据信息,并提高了查询效率。  相似文献   

8.
XML数据的B+树存储实现及更新   总被引:1,自引:0,他引:1  
XML已成为Web数据表示和交换的标准,如何有效实现对于XML数据的存储、查询及更新操作是XML相关技术研究中的一个重要领域.本文简要介绍了基于模式匹配的XML数据库系统(DISXDBS)组成,重点研究了基于模式匹配的XML数据库系统(DISXDBS)上实现用B^+树存储XML文档以及对其进行查询、更新等简单操作,并对目前几种常见XML文档的存储策略进行比较.  相似文献   

9.
基于DOM的XML解析与应用   总被引:1,自引:0,他引:1  
随着XML的广泛应用,大量的信息都将通过XML文档来进行存储、交换,因此熟悉和掌握一种解析XML文档的方法是很重要的.着重介绍基于DOM的XML解析的特点、实现和在数据存储方面的应用,对推广应用XML和DOM技术有一定的实用意义.  相似文献   

10.
文章叙述Web数据挖掘的概念、分类、技术等,重点讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号