共查询到10条相似文献,搜索用时 15 毫秒
1.
基于用户访问树的Web日志挖掘数据预处理 总被引:1,自引:0,他引:1
在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果.提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理. 相似文献
2.
随着移动网络的快速发展和智能手机的不断普及,移动互联网的用户规模与日剧增,各类业务应用也层出不穷.为分析移动互联网中各类业务的访问特性,文中首先引入复杂网络的研究方法,建立了一个加权用户-业务二分网络分析模型;然后对现有移动互联网的主要业务应用进行了分类,并利用从某移动通信运营商的互联网网关上采集的2010年和2011年部分数据集,基于该模型从用户访问兴趣、业务点击量特性、业务流量特性、访问关联性等方面分析了移动互联网的业务访问特性,并比较了用户访问行为的变化.结果发现:门户网站、搜索引擎、社交网站和网络文学是用户访问的主要业务类型;用户访问兴趣范围服从指数分布,用户访问的兴趣强度服从幂律分布;点击量大的网站具有流量相似性而点击量小的网站则没有,但当点击量达到一定规模时则会呈现出流量相似性;在访问关联性方面,门户网站和搜索引擎是最容易被关联访问的业务类型,其次是电子邮箱和社交网站. 相似文献
3.
4.
Web日志隐含了用户访问网站的行为和特点,对其进行聚类分析可以获取用户的浏览模式,发现用户访问网站的偏好和兴趣,从而优化站点结构,实现个性化的服务。针对Web日志数据特点,本文提出免疫网络聚类算法。该算法将Web服务器看成生物机体,用户访问Web的请求序列看成需要检测的入侵抗原,模拟抗体学习抗原的生物机理,自动生成代表用户访问模式的记忆抗体,实现动态聚类。 相似文献
5.
6.
7.
在线交易日志,即用户通过电商平台购买商品产生的交易记录,包括用户、商品、交易及商家的相关信息,反映了用户的购买行为.现有的可视化方法未能充分结合在线交易日志的时序、层次、地理、多维等特征,实现对用户购买行为的多角度分析.对此,本文结合交易日志的多个特征,提出了基于径向布局的复合时序可视化方法和融合空间信息的时间轴可视化方法,设计了颜色极值映射方法和规律映射方法,并基于上述方法,设计并实现了面向在线交易日志的用户购买行为可视化分析系统UPB-VIS,从而完成了单个用户和用户群体购买行为的全方位分析.最后,通过在京东商城在线交易日志数据集上的实验证明了系统的易用性和相关可视化方法的有效性. 相似文献
8.
Web日志挖掘在网络教学中的应用研究 总被引:1,自引:0,他引:1
冯春辉 《计算机技术与发展》2010,20(6):183-187
在网络教学模式下,学生学习的过程就是访问教学网站页面的过程,这些访问都能被完整地记录在系统日志中,通过对日志的分析挖掘,可以找出学生行为模式;在另一方面,教学网站的结构组织是不是符合学生和教师学习和教学的规律,通过对网站日志的分析也可以得到.所有这些都离不开数据挖掘技术.文章提出了基于Wdb日志挖掘的模型,并对组成该系统的关键模块进行了分析.通过统计分析挖掘页面兴趣度和分类聚类方法对学生进行划分,有效地改善网站结构、更好地为学生服务,提高教学质量水平. 相似文献
9.
近年来,Web使用挖掘成为数据挖掘领域中一个新的研究热点,Web使用挖掘是从记录了大量网络用户行为信息的Web日志中发现用户访问行为特征和潜在规律.本文结合某高校主页的真实运行数据,通过Web使用挖掘对于网站的运行日志文件进行全面的挖掘分析,分析用户对信息内容的兴趣度,并通过用户对网页的访问数据推算出各个页面受众的兴趣度高低,借此改良网站的内容和布局. 相似文献
10.
吴明恕 《计算机光盘软件与应用》2011,(7)
本文简要概述了ASP.NET网站中Global.asax文件,比较了该文件中四种典型的方法,得出可以在Session-Start方法实现对网站访问的记录,从而达到统计网站访问情况的目的.本文以记录用户IP访问记录为例,给出了访问日志记录的数据库设计以及在Session-Start方法中实现记录用户IP的完整代码,并时Session-Start方法在多用户并发访问情况下处理进行了讨论.Session-Start方法依赖于用户会话SessionID,由于会话过期策略的限制,用户在连续时间的访问可能会被多次记录,但作为一般统计用途的日志记录,并不需要精确地记录每一条到访数据,可以根据网站实际访问停留情况对会话的过期策略进行相应的调整,减少重复记录的生成. 相似文献