首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
Web日志挖掘数据预处理方法研究   总被引:1,自引:0,他引:1  
Web日志挖掘通过分析Web服务器的日志文件发现用户访问站点的浏览模式,预处理是保证高效、快速地挖掘到正确、有用的模式最为关键的环节.笔者分析了数据预处理的具体过程,并对数据预处理方法进行了深入的研究.  相似文献   

2.
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式.  相似文献   

3.
Web日志数据预处理   总被引:1,自引:0,他引:1  
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式.  相似文献   

4.
基于Web日志挖掘的客户访问兴趣分析   总被引:4,自引:0,他引:4  
数据预处理是Web日志挖掘中的一项关键技术,如何分析客户访问兴趣是Web挖掘中的一个重要研究课题。概述了Web日志挖掘的概念、方法和步骤,重点分析了数据预处理的主要步骤及其实现技术,考虑客户访问路径和浏览时间长度等因素,给出并计算分析了网站用户的访问兴趣的方法。汽修之家网站日志的实际测试结果表明了该方法的有效性。  相似文献   

5.
Web日志挖掘技术的研究与应用   总被引:1,自引:0,他引:1  
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文首先分析了Web日志的格式,再对Web日志挖掘过程中的数据预处理进行了深入的讨论,最后阐述了Web日志挖掘在网站建设上的应用。  相似文献   

6.
为了提高对分布式Web日志数据的准确挖掘能力,提出基于用户访问树的分布式Web日志挖掘算法.构建分布式Web日志的信息分布式检测模型,采用模糊信息粗糙集调度方法进行分布式Web日志信息的结构重组,提取分布式Web日志的统计特征量,采用用户访问树特征聚类方法进行分布式Web日志数据的空间分布式重组,结合粗糙集特征匹配方法...  相似文献   

7.
随着数据挖掘和万维网技术的结合,使得从收集到的访问Internet网页的网站日志记录中执行数据挖掘成为可能。将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,便形成了Web访问模式挖掘。Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,用于找出头N个用户,头N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的。Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了Web访问模式挖掘的概念、方法和过程。  相似文献   

8.
网站个性化服务的研究   总被引:6,自引:0,他引:6  
利用Web数据挖掘技术,对用户未来的访问进行预测和推荐,是实现网站柔性个性化服务的研究方向之一.笔者通过对网站个性化服务相关技术的研究,改进了对Web服务器用户访问日志信息进行聚类分析的关联数据竞争聚类(competitive agglomeration for relation data,CARD)算法,并在此基础上构建了相应的实验模型.CARD算法是CA算法的一种改进算法,适合于处理没有明显特征的Web数据.试验是建立在真实的Web日志上的,实验证明该算法具有较好的聚类效果和适用度.  相似文献   

9.
主要研究Web日志挖掘预处理过程中的四项主要技术;对传统的预处理算法做了优化整合;给出一个更加实用的Web日志挖掘预处理算法。实验结果表明,改进后的预处理算法可以提高挖掘结果的兴趣度,同时提高智能站点所生成推荐结果的质量。  相似文献   

10.
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAPBUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析.  相似文献   

11.
网络使用挖掘是利用数据挖掘技术从网络用户浏览行为中发现各种信息.这些访问请求信息一般被保存在服务器的访问日志中.网络使用挖掘的第一阶段是数据预处理阶段,在数据预处理阶段,首先从服务器日志中过滤出有关信息.之后将属于同一个用户的访问请求合并为一组用户会话.最后将面向时间和面向导航相结合的启发式进行会话构造.在传统的启发式会话构造方法中加入网站拓扑信息,以达到提高会话构造准确性的目的.  相似文献   

12.
随着数据挖掘和万维网技术的结合,使得从收集到的访问 Internet网页的网站日志记录中执行数据挖掘成为可能.将数据挖掘技术应用于 Web日志记录,来发现用户访问 Web页面的模式,便形成了 Web访问模式挖掘. Web访问模式挖掘是从 Web访问日志中挖掘有用的用户访问信息,用于找出头 N个用户,头 N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和 Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的. Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了 Web访问模式挖掘的概念、方法和过程.  相似文献   

13.
会话识别是网络日志预处理中的重要环节,传统网络日志数据的预处理采用固定阈值会话识别算法,不能较好消除网络日志中的冗余信息。为更好提高后继数据挖掘的效率和精度,提出一种改进的预处理网络日志数据的会话识别算法,根据内容及站点结构确定其重要程度,对时间阈值进行动态控制调整,根据用户对访问内容的兴趣度删除不感兴趣的页面,消除冗余信息。  相似文献   

14.
基于web挖掘的个性化远程教学模型研究   总被引:2,自引:0,他引:2  
提出一种基于web挖掘的个性化远程教学服务系统模型,重点阐述模型结构及功能,并介绍所用到的关键挖掘算法.该系统能充分利用网站上积累的web日记、学生行为及学习成绩记录等信息,通过数据挖掘技术发现用户频繁访问路径、频繁项目集及关联规则模式,自动调整学习者的学习计划和进度,呈现个性化的学习内容,创建自适应教学网站,满足各类学习者需要.  相似文献   

15.
Web信息查询是Web应用领域中的一个重要研究课题.介绍了XML数据模型,并从建立XML数据源、Web查询过程及查询实例3个方面,讨论了XML在Web查询中的应用.  相似文献   

16.
Web 信息查询是 Web 应用领域中的一个重要研究课题.介绍了 XML 数据模型,并从建立 XML 数据源、Web 查询过程及查询实例3个方面,讨论了 XML 在 Web 查询中的应用.  相似文献   

17.
目的为了有效地预测用户在信息检索过程中可能点击的检索结果,从而进行网页的智能推荐.方法采取网络日志挖掘的技术,通过词频信息和知网(HowNet)中词的概念计算模型计算网页文档间的主题相关度,再将该语义信息与统计模型计算的条件概率值相结合,以此作为网页推荐的依据.结果提出了一种检索推荐统计模型,并构建了相应的原型系统,实验表明该方法显著提高了推荐系统的准确率.结论这项技术有效地提高了推荐结果与用户信息需求的相关程度,使推荐系统的性能获得了较大地提高,可以很好的应用于信息检索的智能推荐服务领域.  相似文献   

18.
基于的嵌入式远程监控页面设计   总被引:1,自引:0,他引:1  
针对CGI技术的不足,介绍了Applet动态Web的开发模式,分析了其应用优势;结合嵌入式远程监控页面的2种应用场合,分析了Applet和嵌入式服务器之间2种不同的数据交互机制,并给出了兼容2种交互机制的具体通信方案;最后详细介绍了这2种应用场合中Applet监控页面的开发过程.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号