首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
Web日志挖掘中的数据预处理的研究   总被引:40,自引:1,他引:40  
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。  相似文献   

2.
Web日志中保存着用户访问网站的大量信息,通过挖掘预处理后的日志数据,可以得到用户聚类,URL聚类以及用户频繁访问路径等诸多有用信息。本文先分析处理网站的日志数据,再阐述了Web日志挖掘的算法,最后讨论了Web日志挖掘的应用。  相似文献   

3.
Web日志数据挖掘的数据预处理方法研究   总被引:18,自引:1,他引:17  
主要介绍了Web用户访问日志数据挖掘数据预处理过程,综述了国际上的研究现状。流行的预处理方法。在对用户访问行为的合理假定基础上,最后提出了基于综合最大前向参引模型和时间窗口模型的新方法。  相似文献   

4.
Web日志挖掘技术的研究与应用   总被引:15,自引:0,他引:15  
肖立英  李建华  谭立球 《计算机工程》2002,28(7):276-277,284
介绍目前世界上两种主要的Web日志挖掘技术(基于Web事务和基于数据立方体)。同时,提出了一个基于Web日志挖掘技术的应用,即用户自适应的Web站点,介绍了这一系统的实现方法和主要特色。  相似文献   

5.
随着Internet的不断发展,数据挖掘技术的研究和应用也越来越成为热点问题,如何把数据挖掘技术应用于Web,从Web服务器的日志中发掘有用的、重要的知识(包括模式、规则等),成为数据挖掘与知识发现的一个重要研究和应用领域,这就是基于Web日志的数据挖掘。  相似文献   

6.
Web日志挖掘中的数据预处理技术研究   总被引:30,自引:0,他引:30  
赵伟  何丕廉  陈霞  谢振亮 《计算机应用》2003,23(5):62-64,67
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。  相似文献   

7.
基于云模型的Web日志数据挖掘技术   总被引:1,自引:0,他引:1  
提出了一种基于云模型理论测试网页对访问者吸引程度的Web日志挖掘方法,协助管理者优化站点结构,改善Web信息服务质量。  相似文献   

8.
OLAP和数据挖掘技术在Web日志上的应用   总被引:15,自引:0,他引:15  
李绍华 《现代计算机》1999,(3):16-18,32
随着WWW网络用户的日益增多,为了改善信息服务的质量,以及从中发掘电子商务方面的商业机会,有必要有网络用户的行为规律加以分析。本文以Web日志上的信息,就数据的通滤和转化,、多维Web日志数据库的建立,OLAP和DM技术的应用等方面问题作了初步的探讨。  相似文献   

9.
文章在分析Web日志的基础上,结合西华师范大学计算机学院WWW站点的访问日志,主要论述了在Web日志挖掘前所做的准备工作--数据预处理.数据预处理是整个Web日志挖掘过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着重要的作用.  相似文献   

10.
Web日志文件的异常数据挖掘算法及其应用   总被引:8,自引:0,他引:8  
赵泽茂  何坤金  陈鹏  景雪琴  蒋霞东 《计算机工程》2003,29(17):195-196,F003
从数量化角度给出了异常数据的一般性定义,以Web服务器日志文件数据为依据,讨论了挖掘异常数据的方法和途径;给出了基于距离的单指标的离散统计法和综合统计法,并结合校园网作了实际的分析处理。结果表明,该方法是可行的。  相似文献   

11.
Web日志挖掘中数据预处理的研究   总被引:14,自引:0,他引:14  
针对框架式页面存在的问题,对数据预处理过程进行了改进,在数据清洗和用户识别部分添加了页面过滤部分,同时对预处理过程中的页面过滤算法和用户识别策略也进行了改进。  相似文献   

12.
Web日志挖掘数据预处理研究   总被引:6,自引:0,他引:6  
随着WWW的广泛应用及相应的Web技术的出现,数据挖掘的研究也进入了一个新的阶段。Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面,而数据预处理在Web日志挖掘过程中起着至关重要的作用。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理。本文针对基于日志的数据挖掘,提出了前期的几种数据预处理方法,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

13.
用户访问模式挖掘中数据预处理问题的研究   总被引:5,自引:0,他引:5  
首先给出了用户访问模式挖掘的概念,然后主要对用户访问模式挖掘中的数据预处理工作中碰到的一些问题及对这些问题的解决方法进行了较为详细的描述。  相似文献   

14.
基于Web的日志挖掘数据预处理方法的研究   总被引:22,自引:0,他引:22  
随着www的广泛应用及相应的Web技术的出现,使数据挖掘的研究进入了一个新的阶段。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理。论文针对基于日志的数据挖掘提出了前期的几种数据预处理方法,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了很好的算法实现。  相似文献   

15.
随着Web上的信息量剧增,Web数据挖掘的作用愈显重要。本文从Web数据挖掘的定义与分类开始分析,简述了Web数据挖掘的主要技术以及存在的主要难题,并分析其应用。  相似文献   

16.
方铖  王琦 《电脑学习》2007,(4):33-33,40
介绍了用于网页智能搜索的数据挖掘技术以及如何创建多维的网页语义数据库。  相似文献   

17.
电子商务的蓬勃发展使企业产生了大量的业务数据,如何有效管理和使用这些海量数据具有重要的现实意义,因此Web数据挖掘成为商务活动的迫切需求。本文介绍了Web数据挖掘技术及其在电子商务中的应用。  相似文献   

18.
模糊聚类的最大树算法在Web页面分类中的应用   总被引:5,自引:0,他引:5  
通过Web日志中记录的客户对Web页面的访问情况建立Web页面的用户访问矩阵,在此基础上构造模糊相似矩阵,根据模糊相似矩阵由最大树算法进行聚类。分析和算例表明,通过模糊相似矩阵进行聚类避免了构造模糊等价矩阵的大计算量,具有简单、快捷,适合处理高维数据的特点。  相似文献   

19.
基于Web的数据挖掘是一个结合数据挖掘和WWW的热门研究主题,它是现代科学技术相互渗透与融合的必然结果。本文阐述了Web数据挖掘的定义、分类和过程,并对Web数据挖掘的应用与发展前景进行了探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号