首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
Web上的数据量急剧膨胀使得进行Web数据挖掘成为数据挖掘技术研究的热点.而XML能够为Web挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.介绍了XML的和Web文本挖掘的概念,提出了一种基于XML的Web文本挖掘模型,剖析了该模型的各个组成部分,给出了该模型的特点.  相似文献   

2.
本文在分析Web数据挖掘相关理论基础上,深入探讨XML在Web数据挖掘中应用问题,利用XML和Web数据挖掘技术的结合点,提出建立基于XML的Web文本数据挖掘模型,为如何从大量的Web资源中获得有价值的知识提供了一种可行的解决方案。  相似文献   

3.
在目前很多网站都是基于HTML的,要对Web进行挖掘面临很多困难。XML的出现给基于Web的数据挖掘带来便利。利用XML和分布式数据挖掘技术将分布在世界各地的Web数据映射为结构化的数据,建立一个具有基本挖掘功能的分布式挖掘模型,并给出实现方案。  相似文献   

4.
随着网络资源的日益丰富,从中发现潜在的、有价值的信息的商业需求一直推动着数据挖掘技术不断向前发展,由于Web数据本身具有半结构化、组织性差的特点,使得Web数据挖掘工作变得十分困难,而XML的出现为Web数据挖掘技术带来了新的契机和巨大的发展。本文介绍了XML技术以及Web数据挖掘,阐述了XML技术在Web数据挖掘中的应用。由于基于XML的Web数据挖掘是一门新兴的技术,如何进一步充分利用Web资源进行数据挖掘还有待于进一步研究。  相似文献   

5.
互联网的广泛应用使Web数据挖掘成为当前数据挖掘技术研究的热点。但由于Web数据存在方式的特殊性使Web数据控制变得十分复杂,而XML的出现为Web数据挖掘技术带来了巨大的发展契机。XML正逐渐成为新一代互联网数据组织和交换的事实标准,两者的结合——基于XML的Web数据挖掘技术成为Web数据挖掘中一个重要的研究课题。文章分析了Web数据挖掘技术的难点,提出了一个基于XML的Web内容数据挖掘系统框架。  相似文献   

6.
面向Web的数据挖掘是当今数据挖掘技术的热点。本文首先介绍数据库挖掘技术和Web挖掘技术的相关背景,然后详细阐述了XML语言的卓越特性及其在Web数据挖掘中的重要应用,最后文章描述了基于XML的Web挖掘的具体过程。  相似文献   

7.
互联网的广泛应用使Web数据挖掘成为当前数据挖掘技术研究的热点.但由于Web数据存在方式的特殊性使Web数据控制变得十分复杂,而XML的出现为Web数据挖掘技术带来了巨大的发展契机.XML正逐渐成为新一代互联网数据组织和交换的事实标准,两者的结合--基于XML的Web数据挖掘技术成为Web数据挖掘中一个重要的研究课题.文章分析了Web数据挖掘技术的难点,提出了一个基于XML的Web内容数据挖掘系统框架.  相似文献   

8.
基于XML的Web数据挖掘模型的设计   总被引:4,自引:0,他引:4  
目前很多网站都是用HTML构建的,要真正做到高效准确的挖掘数据非常困难,XML的出现为基于Web的数据挖掘带来了便利.在研究Web数据挖掘技术的基础上,利用XML数据抽取技术将半结构化数据映射为结构化数据,建立了一个具有基本挖掘功能的面向多种Web数据的挖掘系统模型Web_mining.最后将Agent技术引入数据挖掘,提出了一种基于Agent技术的体系结构,用来实现大容量的数据在分布式存放情况下的数据挖掘,并对基于Web的数据挖掘技术进行深入的研究和探讨.  相似文献   

9.
由于Web数据所具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘.基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘.文中综述了基于Web的数据挖掘技术,并且介绍了一种全新的技术XML.XML的推广和使用,对于推动Web挖掘和知识获取具有重要的意义.如何进一步的开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究.Web数据挖掘的研究具有极大的挑战性同时又具有极大的开发潜力.  相似文献   

10.
面向Web的数据挖掘是当今数据挖掘技术的热点。本文首先介绍数据库挖掘技术和Web挖掘技术的相关背景,然后详细阐述了XML语言的卓越特性及其在Web数据挖掘中的重要应用,最后文章描述了基于XML的Web挖掘的具体过程。  相似文献   

11.
一种新型的Web挖掘数据采集模型   总被引:1,自引:0,他引:1       下载免费PDF全文
本文在简要论述了当前Web挖掘采用的数据源不足后,分析了XML文档结构与Web挖掘算法结构的相似性,提出了采用XML技术在应用服务层采集用户访问数据的数据源模型X-DIM,并分析了它的优越性。该模型克服了以往基于Web访问日志在数据预处理中的一系列问题,具有数据完备、准确度高、便于为挖掘算法使用等优点,有较高的应用价值。  相似文献   

12.
基于XML的Web数据挖掘的研究   总被引:4,自引:1,他引:4  
1.引言传统的数据挖掘方法一般是针对数据库或数据仓库中的结构化数据进行的,但在现实世界中,人们面对的数据绝大部分是属于非结构化或半结构化的,例如Web页面。我们知道,Web的数据量目前至少可以用数百兆兆字节计算,且仍在迅速增长。这些数据一方面为数据挖掘提供了丰富的资源,另一方面也对数据挖掘技术提出了严峻的挑战。与传统的数据挖掘相比,实现Web数据挖掘的主要困难表现在以下三个方面:第一,Web页面缺乏统一的结构,Web上的每一个站点就  相似文献   

13.
基于XML的Web数据挖掘关键技术的研究   总被引:8,自引:0,他引:8       下载免费PDF全文
由于存在着大量的在线信息,WWW成为数据挖掘的热点。该文介绍了Web网页的数据挖掘技术,提出一种基于XML的Web数据挖掘模型,阐述将半结构化HTML文档转换成良构的XML文档的原因,并给出基于HTML Tide库的转换代码,介绍了利用XML技术从Web网页析取数据的关键技术,包括XHTML、XSLT和XQuery等,对Web数据挖掘的其他方面如数据检验和集成作了一定的探讨。  相似文献   

14.
利用XML技术解决Web数据挖掘中数据异构的问题   总被引:1,自引:0,他引:1  
讨论了Web数据挖掘中的数据异构问题,通过XML技术建立了一个半结构化数据模型和一个自动抽取模型,以解决Internet上绝大多数因异构、非结构化、动态数据集成问题所导致的Web数据挖掘的困难。  相似文献   

15.
随着信息技术的发展,web挖掘技术已成为数据挖掘技术的研究热点。本文针对Web挖掘中数据库环境的异构和信息半结构化等难题,提出了一个Webservices框架下的Web挖掘实现方案,使用XML关键技术对异构信息进行包装,使之成为统一的数据模式,从而可以采用数据挖掘技术从海量异构信息中提取出更加有用的信息。  相似文献   

16.
XML是连接Web和数据库的桥梁,针对B/S模型的Web数据库存在的不足,本文提出并构建了基于XML的Web数据库三层体系结构模型,并围绕网络购物系统的开发进行阐述。  相似文献   

17.
基于XML Web 服务的产品数据共享模型研究   总被引:1,自引:0,他引:1  
提出了基于XML Web服务的产品数据共享模型。首先,分析将产品数据作为服务发布的意义,并制定以XML Web服务方式共享产品数据的原则;其次,探讨了产品数据XML Web服务中二进制数据的发布的问题;最后,提出基于XML Web服务的产品数据共享体系结构。  相似文献   

18.
新一代互联网Web2.0的普及和发展,对Web环境下的数据交换提出了更高的要求。文中首先分析了当前Web数据交换所面临的困难,接着介绍了XML技术及其优点,最后对XML在Web数据交换上的应用进行了说明。XML的推广和使用对于推动Web数据交换具有重要意义。  相似文献   

19.
基于XML的Web内容挖掘逐渐成为Web数据挖掘的重要研究课题。论文定义了用户模型,通过三种途径建立用户模型,将XML和个性化技术应用到Web内容挖掘,设计了一个基于XML的个性化Web内容挖掘系统(PWCMS),并讨论了PWCMS的关键技术及实现。实践证明,将XML和个性化技术应用到Web内容挖掘是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号