首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
Web使用模式挖掘的研究   总被引:6,自引:0,他引:6  
Web挖掘是传统数据挖掘技术在Web环境下的应用,Web挖掘分为Web内容挖掘、Web结构挖掘和Web使用模式挖掘。Web使用模式挖掘是从用户浏览网站的数据中抽取感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构或为用户提供个性化的服务。文章主要论述了Web使用模式挖掘。  相似文献   

2.
Web挖掘研究   总被引:27,自引:2,他引:27  
Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴涵着具有潜在价值知识的分布式信息空间,为数据挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先概述了数据挖掘的概念、挖掘算法及其主要应用领域,然后结合Web数据的多样性、丰富和动态的超链接信息以及Web用户访问信息,详细阐述了Web内容挖掘、Web结构挖掘和Web用户访问信息挖掘的概念、定义、主要的挖掘算法及最新研究进展,文章最后介绍了Web挖掘的研究方向和发展趋势。  相似文献   

3.
申利民  汪新俊 《微机发展》2006,16(2):157-159
现今Web站点是越来越复杂而且不智能化。用户在访问Web站点时经常会碰到很多问题,主要原因是Web站点对用户的需求缺乏适应性。文中研究了自适应Web站点,提出一个理论框架,并针对此框架给出一个构建自适应Web站点的系统架构,介绍了使用文本挖掘方法和Web用法挖掘方法,改善Web站点的结构和组织形式以使站点达到更好的效果。主要通过挖掘Web服务器日志数据使站点更容易访问。  相似文献   

4.
Web用户访问多是匿名访问,Web日志挖掘的主要目标是从Web访问记录中抽取用户行为模式,通过分析挖掘结果理解用户的行为,从而改进站点的结构.Web日志挖掘第一步是进行数据预处理.数据预处理是Web页面分析中最耗时的阶段,首先研究了数据预处理的过程,包括数据清洗、用户识别、会话识别、路径补充.提出了一种路径补充的算法,...  相似文献   

5.
Web挖掘常常被分成Web内容挖掘、Web结构挖掘和Web使用挖掘三类。Web使用挖掘又称为Web日志挖掘,是指从万维网用户的导航行为中发现有价值的信息的一种数据挖掘技术。Web日志挖掘一般有4个步骤:数据预处理、挖掘过程、模式分析和知识发现。数据预处理是对网站日志文件中的数据进行整理,清洗不完全的、杂乱的、噪声数据;模式分析是指提取用户不感兴趣的信息,并找到用户感兴趣的模式的过程;知识发现是指从日志文件中收集并发现有用知识的统计。主要介绍Web日志挖掘与Web结构挖掘相结合来完成挖掘过程及其应用。  相似文献   

6.
Web使用挖掘研究   总被引:5,自引:1,他引:5  
Web数据挖掘是数据挖掘技术在Web信息仓库中的应用与研究。Web数据挖掘包括Web内容挖掘、Web结构挖掘和Web使用挖掘三个研究方向,文中研究的重点是Web使用挖掘。Web使用挖掘研究的主要对象是用户的使用记录,研究的主要过程包括数据预处理、模式发现和模式分析。文中详细介绍了Web使用挖掘的最新研究成果,并对将来技术的研究方向和发展趋势进行了探讨性的预测与分析,为进一步的理论研究和实际应用工作提供了指导性的建议。  相似文献   

7.
现今Web站点是越来越复杂而且不智能化。用户在访问Web站点时经常会碰到很多问题,主要原因是Web站点对用户的需求缺乏适应性。文中研究了自适应Web站点,提出一个理论框架,并针对此框架给出一个构建自适应Web站点的系统架构,介绍了使用文本挖掘方法和Web用法挖掘方法,改善Web站点的结构和组织形式以使站点达到更好的效果。主要通过挖掘Web服务器日志数据使站点更容易访问。  相似文献   

8.
基于Web挖掘的个性化技术研究   总被引:20,自引:5,他引:20  
针对用户特性向用户提供个性化服务已经成为Web技术的研究热点。Web挖掘是实现Web个性化服务的关键技术之一。研究了Web挖掘技术,阐述了Web挖掘技术存在的不足,并对应用Web挖掘技术实现个性化服务的发展前景进行了分析。  相似文献   

9.
Web数据挖掘是数据挖掘技术在Web信息仓库中的应用与研究.Web数据挖掘包括Web内容挖掘、Web结构挖掘和Web使用挖掘三个研究方向,文中研究的重点是Web使用挖掘.Web使用挖掘研究的主要对象是用户的使用记录,研究的主要过程包括数据预处理、模式发现和模式分析.文中详细介绍了Web使用挖掘的最新研究成果,并对将来技术的研究方向和发展趋势进行了探讨性的预测与分析,为进一步的理论研究和实际应用工作提供了指导性的建议.  相似文献   

10.
分析了基于用户兴趣的Web挖掘中用户身份识别的重要性,以及对下一步路径填充的影响.针对目前众多的Web挖掘用户身份识别方法的缺陷,提出了一种基于兴趣的Web挖掘用户身份识别新方法.该方法通过取得用户的CPU号或网卡号,对用户的打扰为零,实现用户的个人身份识别.该方法简单易行,对Web挖掘中用户身份识别所存在的5个难题解决4个,提高了用户身份识别的准确率,为Web挖掘的准确性提供了保障.  相似文献   

11.
数据预处理是Web使用挖掘的一个关键环节,其结果直接影响到后续的事务识别、路径分析、关联规则挖掘和序列模式挖掘的结果。提出了一种用户识别的通用算法、路径补充的启发式策略和基于主题规约的方法,并用实验证明了其高效性。  相似文献   

12.
通过分析Web日志数据源的不准确性,提出了对Web日志数据源进行数据预处理的技术。结合实例详细介绍了数据净化、用户识别、会话识别、路径补充和事务识别等数据预处理技术。  相似文献   

13.
This paper presents a comprehensive survey of web log/usage mining based on over 100 research papers. This is the first survey dedicated exclusively to web log/usage mining. The paper identifies several web log mining sub-topics including specific ones such as data cleaning, user and session identification. Each sub-topic is explained, weaknesses and strong points are discussed and possible solutions are presented. The paper describes examples of web log mining and lists some major web log mining software packages.  相似文献   

14.
基于用户行为的Web使用挖掘数据采集技术研究   总被引:2,自引:0,他引:2  
如何准确、及时、全面地采集用户使用数据是Web使用挖掘研究重要的前提和基础.本文从用户行为视角,讨论了传统的基于Web日志进行Web使用挖掘研究所面临的问题,对基于用户行为的Web使用挖掘的数据采集技术进行了深入分析,重点研究了主动式服务器端数据采集方法和客户端数据采集方法.  相似文献   

15.
近年来,Web使用挖掘成为数据挖掘领域中一个新的研究热点,Web使用挖掘是从记录了大量网络用户行为信息的Web日志中发现用户访问行为特征和潜在规律.本文结合某高校主页的真实运行数据,通过Web使用挖掘对于网站的运行日志文件进行全面的挖掘分析,分析用户对信息内容的兴趣度,并通过用户对网页的访问数据推算出各个页面受众的兴趣度高低,借此改良网站的内容和布局.  相似文献   

16.
该文介绍了Web使用挖掘流程及所采用的数据挖掘技术,通过对Web使用模式挖掘结果的分析,探讨Web使用挖掘在电子商务网站设计优化中的应用,使网站设计更加符合用户需求,从而促进企业电子商务活动的发展。  相似文献   

17.
基于Web数据挖掘的一种个性化方法   总被引:2,自引:0,他引:2  
文章应用Web数据挖掘的相关知识,对网站内容现有的资源内容设立相关度,根据网站用户日志,使用在线分析的方法对用户行为模式进行分析挖掘,根据网站类别内容的相关度预测用户的兴趣,为用户提供最合适更具人性化的信息资源。  相似文献   

18.
数据挖掘技术分支很多,其中,基于用户访问模式的挖掘(也称Web日志挖掘或使用记录的挖掘)对于一个企业网站的建设有重要的意义.本文结合一个大型图书网站的建设,来研究基于用户访问模式的数据挖掘技术在大型网站中的应用.首先介绍了用户访问模式(Web使用记录)挖掘的基本流程,接着详细介绍了数据结构的设计,数据顸处理,挖掘算法的应用,规则的生成等关键性的数据挖掘技术,最后介绍了产生的规则的应用.  相似文献   

19.
在对Web应用挖掘的基本步骤作系统性研究的基础上,设计了一个基于Web日志文件的关联规则挖掘模块。该系统应能够对用户访问Web时服务器方留下的访问记录进行挖掘,从中得出用户的访问模式和访问兴趣。为了识别用户浏览模式,实现了利用关联规则挖掘算法Apriori对Web应用挖掘过程中预处理阶段所产生的用户会话文件进行挖掘的模块,该模块针对用户选定的若干页面产生满足最小支持度和最小置信度的页面之间的强关联规则,并以文本的形式显示挖掘的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号