首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
具有访问时间完整性的Web日志方法   总被引:4,自引:0,他引:4  
Web服务器日志记录了外部用户对本服务器的访问信息,是分析网站的重要数据。但是根据当前流行的几种Web日志格式来看,它们所记录的时间数据并不完整;当用户访问一个网页时,只记录了访问该网页的开始时间,而没有记录访问结束时间。这将造成访问信息的丢失,给今后的分析工作(如访问时间统计、用户会话识别等)带来困难。本文提出了一种Web日志方法,它能克服目前Web服务器日志的这一缺点,记录完整的时间信息.  相似文献   

2.
结合网站内容和结构进行的Web日志挖掘   总被引:7,自引:1,他引:7  
提出一种以聚类为基础的Web日志挖掘方法:从Web日志事务、Web站点内容和Web站点结构3个不同方面来聚类页面集合,并通过将用户的访问记录和页面聚集进行匹配和相关度计算,来预测用户感兴趣的页面。  相似文献   

3.
通过对网络Web服务器日志中记录的大量用户信息进行Web日志分析,研究在Web服务器中及其系统中引入和实现Qos控制的机制和策略,了解用户习惯,提高服务质量和效率。  相似文献   

4.
设计并实现了一个Web日志挖掘系统,将Web日志挖掘应用到校园网站,对其Web服务器的日志记录进行挖掘,并将挖掘出的模式应用于智能Web站点的构建。  相似文献   

5.
通过对网络Web服务器日志中记录的大量用户信息进行Web日志分析,研究在Web服务器中及其系统中引入和实现Qos控制的机制和策略,了解用户习惯,提高服务质量和效率.  相似文献   

6.
在Web数据挖掘研究领域中,Web日志挖掘是一个极其重要的应用方面,而数据预处理技术在Web日志挖掘中又起到非常重要的作用.介绍Web日志文件的记录格式和Web日志挖掘预处理的一般过程,针对实际应用中遇到的问题提出一种解决方法,最后给出算法代码.  相似文献   

7.
基于Web日志分析的Web QoS研究   总被引:4,自引:0,他引:4  
Internet的服务模式正由传统的数据通信与信息浏览向电子交易与服务转变,需要对不同的用户或HTTP请求提供区分服务和性能保证.本文通过对网络Web服务器日志中记录的大量用户信息进行Web日志分析,研究在Web服务器中及其系统中引入和实现Qos控制的机制和策略,了解用户习惯,提供个性服务,提高服务质量和效率.  相似文献   

8.
从Web日志挖掘存在的困难和不足出发,结合电子商务个性化服务的特点,引入用户访问记录进行Web挖掘,提出了一种Web挖掘中数据采集与预处理的新思路,指出了该思路的实现方法和特点。提出了引入用户访问记录后的Web挖掘体系结构。  相似文献   

9.
统一事件Web挖掘模型   总被引:1,自引:0,他引:1  
讨论了电子商务中现有数据收集方式的缺点。基于Web日志的推荐算法具有复杂而不精确的预处理步骤,而客户端收集数据涉及到用户隐私问题。提出了统一事件模型、基于应用层的日志记录,进行用户、会话识别算法和多维关联规则算法UEMFP。指出了UEM在Web挖掘中的优点。实验表明,UEM下的Web挖掘算法具有更好的结果和性能,它可以很好地运用到电子商务应用中。  相似文献   

10.
Web使用挖掘是数据挖掘技术在Web信息仓库中的应用.Web使用挖掘通过挖掘Web服务器日志获取的知识来预测用户浏览行为,是Web挖掘技术中的一个重要研究方向.通常发现的知识或一些意外规则很可能是不精确的、不完备的,这就需要用软计算技术如粗糙集来解决.提出一种基于粗糙近似的聚类方法,该方法能够实现从Web访问日志中聚类Web事务.通过这种方法可以有效地挖掘Web日志记录,从而发现用户存取Web页面的模式.  相似文献   

11.
一种基于异构系统发现日志本体关联规则的方法   总被引:1,自引:0,他引:1  
孙明  陈波  周明天 《计算机科学》2009,36(12):187-190
构建日志本体之上的访问模式关联规则是语义Web使用挖掘的主要任务之一.在DL-safe规则的限定下,将日志本体和一阶应用规则相结合,构成异构日志知识库,以提高Web日志系统的知识表示和推理能力.在此基础上借助ILP理论从异构日志知识库中挖掘出频繁用户访问模式,并生成访问模式关联规则,以发现用户访问行为之间更丰富的潜在关联知识.该方法提高了语义Web使用挖掘的质量,为改进站点结构提供了更有效的决策知识.实验结果证明了该方法的可行性和有效性.  相似文献   

12.
基于本体的Web使用知识发现模型及应用   总被引:3,自引:0,他引:3       下载免费PDF全文
何丽  严冬梅  韩文秀 《计算机工程》2006,32(14):169-171
本体在Web上的应用能够有效解决Web信息共享的语义问题。该文提出了基于Web本体和服务器日志文件的知识发现模型,主要讨论了用户访问行为的表示、语义用户分布的定义及发现算法。最后介绍了Web使用知识发现模型在Web个性化系统中的应用。  相似文献   

13.
Web日志挖掘数据预处理研究   总被引:6,自引:0,他引:6  
随着WWW的广泛应用及相应的Web技术的出现,数据挖掘的研究也进入了一个新的阶段。Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面,而数据预处理在Web日志挖掘过程中起着至关重要的作用。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理。本文针对基于日志的数据挖掘,提出了前期的几种数据预处理方法,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

14.
张璞 《计算机工程》2009,35(5):243-245
利用J2EE技术开发Web应用系统时经常需要编写大量代码来处理组织机构管理、权限管理、日志管理等基础业务,对于大量结构相似的业务处理页面仍需要手工编码,导致开发工作量增大,开发周期变长。针对这些问题,设计并实现了一个Web应用基础业务框架,该框架提供相关基础业务模块供开发Web应用系统使用,使用自动化生成工具来生成Web应用系统中的大量数据维护页面。工程实践表明,该框架能够较大程度地提高Web应用系统的开发效率,缩短开发周期,增强系统的可扩展性。  相似文献   

15.
Web挖掘是数据挖掘的重要研究分支之一。Web日志文件为Web挖掘提供了数据源,日志信息的孤立点检测是数据预处理的重要环节。介绍Web日志文件的构成,提出一种基于Web日志文件的孤立点检测算法,通过实验对算法进行进一步分析,并对其应用领域做简单概括。  相似文献   

16.
一种分布式Web日志挖掘系统的设计与实现   总被引:5,自引:1,他引:5  
陶剑文 《计算机仿真》2006,23(10):109-112
Web挖掘已从早期的理论研究逐步转向实用阶段,可以利用对Web日志的挖掘发现用户的浏览模式、分析站点的使用情况。有效的Web日志挖掘工具是Web日志挖掘应用成功的关键。针对Web日志挖掘工具存在的问题与不足,提出了一种新颖的基于移动Agent技术的分布式Web日志挖掘系统(MAWLMS)的体系结构。重点阐述了移动代理层的设计,详细说明了移动Agent挖掘算法的设计与实现,包括最大向前路径识别算法和频繁遍历路径发现算法。最后对MAWLMS系统进行了验证,实验结果显示基于MAWLMS系统的分布式Web日志挖掘是可行且有效的。  相似文献   

17.
基于多代理技术的分布式Web日志挖掘系统   总被引:1,自引:7,他引:1  
马征  李建华 《微计算机信息》2004,20(2):113-114,83
在分析分布式Web日志挖掘的困难以及介绍多代理的概念和特性后,提出了一个基于多代理技术的分布式Web日志挖掘系统的体系结构。介绍了Web日志挖掘过程以及多代理在该系统中的应用。  相似文献   

18.
基于Web日志的数据预处理研究   总被引:1,自引:0,他引:1  
详细介绍Web日志挖掘的数据预处理过程.通过对预处理的结果用户会话文件进行处理,构造出扩展有向树模型,并从每个用户会话文件中发现该用户所有的最大向前引用路径,为实施Web日志挖掘算法提供数据基础.  相似文献   

19.
近年来随着Web应用技术的不断进步和发展,针对Web应用业务的需求越来越多,随之而来的Web应用安全攻击也呈上升趋势.目前针对网络攻击的防护技术手段也是层出不穷,但一般都是事前检测和事中防护,事后检测维护的则相应比较少.在网络中心有大量的服务器设备,Web日志文件作为服务器的一部分,详细记录设备系统每天发生的各种各样的事件,如客户端对服务器的访问请求记录、黑客对网站的入侵行为记录等,因此要想有效的管理维护设备和在攻击事件发生后及时的降低风险,分析审计日志对于事后检测和维护设备的安全是非常必要的.基于此,文章主要对基于Web应用安全日志审计系统进行研究和设计,日志审计系统主要分为三个子系统:日志采集子系统、分析引擎子系统和日志告警子系统.日志采集子系统采用多协议分析对日志进行收集,并进行相应的日志规范化和去重等处理.分析引擎子系统采用规则库和数理统计的方法,对日志特征进行提取和设置相应的统计量参数,进行比较分析.日志告警子系统则是主要配置相应策略并下发任务,对于审计结果进行界面展示或生成报告并以邮件的方式发送给用户等.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号