首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
Web上的数据量急剧膨胀使得进行Web数据挖掘成为数据挖掘技术研究的热点.而XML能够为Web挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.介绍了XML的和Web文本挖掘的概念,提出了一种基于XML的Web文本挖掘模型,剖析了该模型的各个组成部分,给出了该模型的特点.  相似文献   

2.
介绍了Web数据挖掘的含义,重点讨论了Web数据挖掘的类型以各种类型的Web数据挖掘的基本过程以及它们所使用的一些相关技术,最后指出网络信息挖掘的应用前景。  相似文献   

3.
提出了一种基于XML的Web数据挖掘模型,该模型能很好地体现XML的优越性,并有效地实现Web数据挖掘。  相似文献   

4.
基于XML的Web数据挖掘关键技术的研究   总被引:8,自引:0,他引:8       下载免费PDF全文
由于存在着大量的在线信息,WWW成为数据挖掘的热点。该文介绍了Web网页的数据挖掘技术,提出一种基于XML的Web数据挖掘模型,阐述将半结构化HTML文档转换成良构的XML文档的原因,并给出基于HTML Tide库的转换代码,介绍了利用XML技术从Web网页析取数据的关键技术,包括XHTML、XSLT和XQuery等,对Web数据挖掘的其他方面如数据检验和集成作了一定的探讨。  相似文献   

5.
面向Web的数据挖掘是当今数据挖掘技术的热点。本文首先介绍数据库挖掘技术和Web挖掘技术的相关背景,然后详细阐述了XML语言的卓越特性及其在Web数据挖掘中的重要应用,最后文章描述了基于XML的Web挖掘的具体过程。  相似文献   

6.
讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

7.
面向Web的数据挖掘是当今数据挖掘技术的热点。本文首先介绍数据库挖掘技术和Web挖掘技术的相关背景,然后详细阐述了XML语言的卓越特性及其在Web数据挖掘中的重要应用,最后文章描述了基于XML的Web挖掘的具体过程。  相似文献   

8.
由于互联网上存在大量的信息资源,Web挖掘已成为数据挖掘的热点。本文介绍Web数据挖掘技术,比较HTML和XML的不同,充分利用XML的优越性,提出一种基于XML的数据挖掘模型,并详细论述该模型的特点及用途。  相似文献   

9.
基于XML数据模型及面向Web数据挖掘技术   总被引:2,自引:0,他引:2  
本文主要对Web上的数据结构特征及其数据挖掘技术进行分析,并就把XML作为一种半结构化的数据模型实施查询与模型抽取,从而完成面向Web数据挖掘的方法,且结合SQLSwrver2000的应用及实现智能查询应答的思想进行探讨。  相似文献   

10.
基于Web的数据挖掘技术的应用研究   总被引:7,自引:0,他引:7  
Web是一个动态性极强的信息源,要访问、分析这些数据必须要研究异构数据的集成问题和选择合适的技术进行数据分析、集成和处理.文中介绍了多数据源数据仓库体系结构,多数据源数据的集成思想和实现的框架;分析了转换器在面向Web的数据挖掘中存在的不足和XML语言的技术特点;提出了应用XML技术对多数据源数据进行集成与转换以便构建数据仓库,同时给出了关键技术的实现方法.  相似文献   

11.
基于XML的Web数据挖掘的研究   总被引:4,自引:1,他引:4  
1.引言传统的数据挖掘方法一般是针对数据库或数据仓库中的结构化数据进行的,但在现实世界中,人们面对的数据绝大部分是属于非结构化或半结构化的,例如Web页面。我们知道,Web的数据量目前至少可以用数百兆兆字节计算,且仍在迅速增长。这些数据一方面为数据挖掘提供了丰富的资源,另一方面也对数据挖掘技术提出了严峻的挑战。与传统的数据挖掘相比,实现Web数据挖掘的主要困难表现在以下三个方面:第一,Web页面缺乏统一的结构,Web上的每一个站点就  相似文献   

12.
一种新型的Web挖掘数据采集模型   总被引:1,自引:0,他引:1       下载免费PDF全文
本文在简要论述了当前Web挖掘采用的数据源不足后,分析了XML文档结构与Web挖掘算法结构的相似性,提出了采用XML技术在应用服务层采集用户访问数据的数据源模型X-DIM,并分析了它的优越性。该模型克服了以往基于Web访问日志在数据预处理中的一系列问题,具有数据完备、准确度高、便于为挖掘算法使用等优点,有较高的应用价值。  相似文献   

13.
为了有效地从Web页面上提取数据信息,本文建立一种基于XML的Web信息收集数据库。利用开源工具JTidy将Web页面加以整理,利用XML良好的结构特性,使用Dom4j工具包解析XML文件;按照XML中的标签层次特点作为对数据进行储存的依据;最后使用Hibernate将数据持久化地储存于数据库中,方便数据的储存与查询。  相似文献   

14.
基于Web的文本挖掘   总被引:22,自引:1,他引:22  
万维网是一个巨大的、分布广泛的、全球性的信息服务中心,它包含了丰富的信息资源。在茫茫的信息海洋如何快速有效地获取所需要的信息,一直是困绕着网上用户的难题。而Web挖掘可以从这个信息海洋中提取出所需要的有用知识,在一定程度上解决了用户的困绕。该文主要介绍了Web挖掘基本情况,并在此基础上对基于Web的文本挖掘进行了分析研究;给出了一个基于Web的文本挖掘的结构模型图。同时,在Web挖掘和数据挖掘研究的基础上,提出了一个智能化、个性化的现代远程教育系统结构模型。它比传统的远程教育系统具有更大的发展前景。  相似文献   

15.
利用XML技术解决Web数据挖掘中数据异构的问题   总被引:1,自引:0,他引:1  
讨论了Web数据挖掘中的数据异构问题,通过XML技术建立了一个半结构化数据模型和一个自动抽取模型,以解决Internet上绝大多数因异构、非结构化、动态数据集成问题所导致的Web数据挖掘的困难。  相似文献   

16.
利用XML技术进行Web内容挖掘   总被引:6,自引:0,他引:6  
互联网的普及,人们频繁地在网络上寻找信息.如何有效地在Web上进行数据挖掘,成为研究的热点,而作为新一代互联网数据组织和交换的事实标准--XML,被提出用于Web数据挖掘,本文提出了一个基于XML的Web内容挖掘系统模型.  相似文献   

17.
XML语言在Web数据挖掘中的应用   总被引:17,自引:0,他引:17  
左开中  汪伟 《微机发展》2002,12(3):59-61
面向Web的数据挖掘是当今数据挖掘技术的热点,文章介绍了该项技术的特点所在,并详细阐述了XML语言的卓越性及其在Web数据挖掘中的重要应用。  相似文献   

18.
基于XML Web 服务的产品数据共享模型研究   总被引:1,自引:0,他引:1  
提出了基于XML Web服务的产品数据共享模型。首先,分析将产品数据作为服务发布的意义,并制定以XML Web服务方式共享产品数据的原则;其次,探讨了产品数据XML Web服务中二进制数据的发布的问题;最后,提出基于XML Web服务的产品数据共享体系结构。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号