共查询到17条相似文献,搜索用时 109 毫秒
1.
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着重要的作用,也是工作量较大的一部分。数据预处理的基本技术,包括数据清理、数据集成和转换、数据归约等。本文介绍了数据预处理中涉及到的数据清理、用户识别、会话识别、路径补充、事务识别等过程,并提出了一种路径补充算法。 相似文献
2.
3.
4.
用户对Web网站访问兴趣可以通过页面的浏览顺序表现出来,Web站点的访问日志记录了用户访问页面的详细信息.介绍Web站点访问日志挖掘的相关知识,并定义新的兴趣度,相似度和聚类中心,提出了一种基于用户访问兴趣的路径聚类算法,最后通过实验来验证这种算法的有效性. 相似文献
5.
Web日志中保存着用户访问网站的大量信息,通过挖掘预处理后的日志数据,可以得到用户聚类,URL聚类以及用户频繁访问路径等诸多有用信息。本文先分析处理网站的日志数据,再阐述了Web日志挖掘的算法,最后讨论了Web日志挖掘的应用。 相似文献
6.
通过分析Web日志数据源的不准确性,提出了对Web日志数据源进行数据预处理的技术。结合实例详细介绍了数据净化、用户识别、会话识别、路径补充和事务识别等数据预处理技术。 相似文献
7.
由于现有的Web日志缺少明显语义,提出一种语义Web日志模型--SWLM,并给出基于该模型的网页和用户聚类算法.通过日志概念的语义距离定量计算来聚类网页和用户,奠定了Web个性化服务的基础.性能测试实验证明,该模型具有较好的整体性能,能有效地进行网页和用户聚类. 相似文献
8.
9.
10.
Web日志是目前Web数据挖掘的重要研究方向。数据预处理是Web日志挖掘中的关键技术。详细的介绍了Web日志挖掘的预处理过程。数据预处理包括数据清理、识别用户、识别会话和框架页面清理、路径补充。用户识别后,框架页面降低了数据挖掘的效率,可以通过过滤框架页面大幅度减少产生的无效页面数。 相似文献
11.
服务器端保存的Web访问日志含有大量的用户浏览信息,因此有效地利用该资源可以挖掘出有用的信息,并能得到用户个人的访问模式,从而为改善站点结构提供了支持。在结合站点拓扑结构的基础上,针对Web日志挖掘数据预处理过程中的路径补充提出了最短向后父节点算法(SBFN)。研究表明该算法能够对Web日志中的用户访问路径进行补充,从而为解决站点结构优化问题提供了方案。 相似文献
12.
数据预处理是Web使用挖掘的一个关键环节,其结果直接影响到后续的事务识别、路径分析、关联规则挖掘和序列模式挖掘的结果。提出了一种用户识别的通用算法、路径补充的启发式策略和基于主题规约的方法,并用实验证明了其高效性。 相似文献
13.
系统是针对奥运专题网站而量身定做的,其功能主要有实现用户登录、用户查询与授权以及修改用户信息;实现信息查询,其中包括新闻信息、图片信息等的查询;实现对系统库的维护。系统需求分析是在系统开发的总体任务的基础上完成的,并从实际应用的角度考虑,能够极大方便客户顺利查询所需要的信息。系统采用JSP语言进行系统开发。通过TOGETHER软件,对系统整体与局部进行设计。采用MYSQL5.0,数据库强大而又高效稳定。采用APACHE公司的TOMCAT5.0作为系统的服务器。采用如今流行的MVC模式进行系统的框架架构。 相似文献
14.
15.
Prior studies have suggested that a good Website design which facilitates a user’s Web browsing behaviour would generally lead to better user performance. In this research, we examine user Website behaviour as a way to understand Website design using a “think aloud” protocol analysis. Main theoretical contributions of this research are the illustration of the flow of cognitive processes during the Website browsing and the establishment of Website design dimensions – the meaning and content implied by Website content, its outward form, and the structure and navigation – in relation to user performance. 相似文献
16.
Web日志挖掘中数据预处理技术的研究 总被引:2,自引:0,他引:2
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别.提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法. 相似文献
17.
传统的网站只是在页面上使用计数器进行简单的访问者数量的统计。随着网站运营规模的扩大,依靠这种简单的数量统计并不能真正对网站运营状况做以全面的评估,难以为网站运营提供有意义的参考;基于Web的网站访问流量统计系统在功能上强化了对用户行为的统计和分析,有利于网站管理者、开发者根据目标客户使用网站的实际情况制定网站经营战略,调整网站运营架构,进而对网站整体进行更有意义的改进。 相似文献