首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 93 毫秒
1.
在Web日志挖掘中,对传统的会话识别方法进行改进,提出了基于统计特征的会话识别方法,通过使用统计值来动态设定访问时间阈值以识别会话.  相似文献   

2.
本文从各种数据源采集方法出发,分析各自的局限性,首先确定面向服务器端进行Web使用挖掘,然后进一步分析服务器端数据源的特性,给出针对此数据源的一种数据预处理方案及改进方法,提出数据净化、用户识别、会话识别等关键预处理步骤,为数据挖掘过程提供尽可能准确的目标数据。  相似文献   

3.
Web日志挖掘预处理研究   总被引:2,自引:0,他引:2  
Web日志挖掘是为网站经营和策略调整提供数据支持的重要手段,但原始的日志数据往往杂乱不完整,非结构化,因此预处理结果的好坏极大影响到挖掘的质量,通过对预处理过程中几个主要步骤进行深入讨论,总结已有的各种处理手段并提出新的改进方法.针对现有预处理方法的局限和不足,对分析网页内嵌元素尤其是图像元素进行了深入研究,提出了相应的处理手段.  相似文献   

4.
基于关联规则的Web日志挖掘算法   总被引:1,自引:0,他引:1  
分析了经典的基于关联规则的Apriori挖掘算法,对该算法在Web日志挖掘中存在的不足进行了讨论。针对这些不足,对该算法进行了改进,并介绍了算法的具体实现。经实验测试,改进后的算法具有更好的效率。  相似文献   

5.
网络使用挖掘是利用数据挖掘技术从网络用户浏览行为中发现各种信息.这些访问请求信息一般被保存在服务器的访问日志中.网络使用挖掘的第一阶段是数据预处理阶段,在数据预处理阶段,首先从服务器日志中过滤出有关信息.之后将属于同一个用户的访问请求合并为一组用户会话.最后将面向时间和面向导航相结合的启发式进行会话构造.在传统的启发式会话构造方法中加入网站拓扑信息,以达到提高会话构造准确性的目的.  相似文献   

6.
本文首先介绍了Web挖掘的基本概念和分类,通过对Web使用挖掘的分析,从而挖掘出有意义的模式、规则,来帮助管理者决策。  相似文献   

7.
Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,以发现相似客户群体、相关Web页面和频繁访问路径等,其目的在于从用户访问Web系统的行为中发现用户的访问模式.在对Web日志挖掘的原理和技术进行讨论的基础上,重点探讨了如何将Apriori改进算法应用于对Web日志的挖掘,提出了一种基于该算法的Web日志挖掘实现方法,实验结果表明了算法的有效性.  相似文献   

8.
为了满足站点上更多用户的需求,基于一种整合Web内容挖掘和使用挖掘的个性化推荐算法,在内容挖掘和使用挖掘的预处理阶段,针对XML文档标签化以及内容动态性的特征,提出了一种新的主题权重以及会话有效性衡量的方法,实验证明该方法的推荐值更具准确性和有效性.  相似文献   

9.
Web日志挖掘技术的研究与应用   总被引:1,自引:0,他引:1  
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文首先分析了Web日志的格式,再对Web日志挖掘过程中的数据预处理进行了深入的讨论,最后阐述了Web日志挖掘在网站建设上的应用。  相似文献   

10.
在Web日志挖掘中应用聚类改进网站结构的研究   总被引:2,自引:0,他引:2  
介绍了Web日志挖掘的概念,通过聚类技术在Web日志中实现挖掘出访问网站的相似爱好的用户群体、页面之间的内在联系,以此改进网站性能和组织结构,提高用户查找信息的质量和效率.  相似文献   

11.
随着数据挖掘和万维网技术的结合,使得从收集到的访问 Internet网页的网站日志记录中执行数据挖掘成为可能.将数据挖掘技术应用于 Web日志记录,来发现用户访问 Web页面的模式,便形成了 Web访问模式挖掘. Web访问模式挖掘是从 Web访问日志中挖掘有用的用户访问信息,用于找出头 N个用户,头 N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和 Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的. Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了 Web访问模式挖掘的概念、方法和过程.  相似文献   

12.
本文介绍了单片机变压器特性测试仪的软硬件结构。文中阐述了功率测量中的时分割乘法器的原理及自动进行温度、电压、电流、频率及互感器引起的角差校正的方法。实际运行结果表明该仪器具有精度高,能耗小,性能稳定等优点。  相似文献   

13.
在日志数据的预处理中,确定合适的挖掘粒度是一项重要任务.提出了一种改进了的用途数据预处理模型,在传统的预处理模型基础上添加了页面视图识别步骤,通过试验可以看到改进后的挖掘粒度有更加明确的语义表达,从而提高了挖掘精度.  相似文献   

14.
在日志数据的预处理中,确定合适的挖掘粒度是一项重要任务。提出了一种改进了的用途数据预处理模型,在传统的预处理模型基础上添加了页面视图识别步骤,通过试验可以看到改进后的挖掘粒度有更加明确的语义表达,从而提高了挖掘精度。  相似文献   

15.
一种Web使用挖掘数据清理方法   总被引:1,自引:1,他引:0  
针对传统的Web使用挖掘数据清理方法不再适用于现有的网络环境的现状,提出了一种新的Web使用挖掘数据清理方法。该方法首次提出以网络流量作为Web使用挖掘的数据来源;将数据清理的问题转变为对用户显式操作产生的HTTP会话的识别问题;使用二进制粒子群算法(BPSO)选出最能精确识别用户显式HTTP会话的特征子集;利用选择出的特征子集,生成决策树用以对用户显式HTTP会话进行识别。实验结果表明:该方法能够准确有效地识别出用户显式HTTP会话,对日志记录数的压缩率达到98.7%,能够完成数据清理的任务,为之后的数据挖掘提供有力的支持。  相似文献   

16.
基于Web使用挖掘的个性化服务系统   总被引:11,自引:0,他引:11  
个性化服务系统是一种由多种WEB挖掘技术构成的基于用户使用的站点个性化系统。该系统使用事务聚类、使用聚类和关联规则技术等数据挖掘技术分析用户访问模式,并结合用户当前访问情况提供实时化个性服务。实验结果说明,个性化服务系统具有较好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号