共查询到20条相似文献,搜索用时 93 毫秒
1.
2.
3.
4.
5.
Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提。通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用户访问页面频度。在这些数据准备工作的基础上,构造了用户一页面关联矩阵,作为改进的模糊C均值聚类算法的输入,实现了相似用户及相关页面的聚类。实验表明改进的FCM算法的有效性。 相似文献
6.
会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法.在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来进行用户的会话识别.最后通过实验数据,与几种传统的会话识别方法进行了比较,表明该算法更为合理有效. 相似文献
7.
模糊C均值聚类算法在Web使用挖掘上的应用研究 总被引:5,自引:3,他引:2
Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提.通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用户访问页面频度.在这些数据准备工作的基础上,构造了用户一页面关联矩阵,作为改进的模糊C均值聚类算法的输入,实现了相似用户及相关页面的聚类.实验表明改进的FCM算法的有效性. 相似文献
8.
9.
10.
本文先将原始Web日志进行预处理,即时Web日志进行数据清洗,用户识别,会话识别和格式转换等.再用蚁群聚类算法对预处理后的日志进行聚类分析,提取具有代表性的用户访问模式,最后用协同过滤推荐技术向网站访问者进行推荐,提供个性化服务,从而实现网站的个性化推荐. 相似文献
11.
12.
13.
本文针对Web日志中用户会话识别阈值问题,给出一种基于时间密度的频度分析方法。文中首先将基于时间间膈参数刻度的用户访问频度定义为一个随机向量,给出了随机向量的切尾算法;然后建立频度与IP用户的相关矩阵,矩阵的列为访问频度,矩阵的行为用户IP,矩阵中的每一个值为某一时间间膈的访问频度。通过列向量的聚类分析,对不同类别用户的访问行为进行探讨。最后,对会话识别的阈值进行参数估计,并通过抽样对阈值进行检测和参数修正。 相似文献
14.
15.
程苗 《计算机工程与应用》2011,47(29):85-89
从Web日志中挖掘用户浏览偏爱路径是一个重要的研究课题。目前的挖掘算法注重客观访问频度,忽略了用户对这一频繁访问路径是否感兴趣。在分析目前用户偏爱路径挖掘算法存在的问题的基础上,结合网站拓扑结构图修正基于频度的用户偏爱路径的衡量标准,提出了有用偏爱度的概念,从而剔除由于页面放置和链接等因素对挖掘的影响;针对目前基于单一节点的挖掘系统的计算能力不足的问题,利用云计算的分布式处理和虚拟化技术的优势,给出了一种基于云计算的数据处理方法,在此基础上挖掘用户浏览偏爱路径。实验表明,该算法针对大数据量的日志进行挖掘,准确率和效率比普通基于频度进行用户浏览偏爱路径挖掘的算法有所提高。 相似文献
16.
陈小莉 《数字社区&智能家居》2009,(10)
Web日志中包含了大量的用户浏览信息,对Web日志进行分析可以发现用户偏好路径容。本文提出了一种基于Web日志挖掘出用户浏览偏爱的路径,根据路径对应的文档内容提取用户偏爱的主题,并向用户推荐偏爱主题内容,从而为个性化学习服务。 相似文献
17.
服务器端保存的Web访问日志含有大量的用户浏览信息,因此有效地利用该资源可以挖掘出有用的信息,并能得到用户个人的访问模式,从而为改善站点结构提供了支持。在结合站点拓扑结构的基础上,针对Web日志挖掘数据预处理过程中的路径补充提出了最短向后父节点算法(SBFN)。研究表明该算法能够对Web日志中的用户访问路径进行补充,从而为解决站点结构优化问题提供了方案。 相似文献
18.
陈小莉 《数字社区&智能家居》2009,5(4):2779-2781
Web日志中包含了大量的用户浏览信息,对Web日志进行分析可以发现用户偏好路径容。本文提出了一种基于Web日志挖掘出用户浏览偏爱的路径,根据路径对应的文档内容提取用户偏爱的主题,并向用户推荐偏爱主题内容,从而为个性化学习服务。 相似文献
19.
Web日志挖掘就是运用数据挖掘技术从Web日志中发现和抽取信息的过程。数据预处理是Web日志挖掘的一个关键环节。对数据预处理的各个环节进行研究,并介绍各个环节中的一些特殊处理方法,根据对Web服务期日志数据格式的分析,对会话概念进行了形式化描述,然后在分析目前会话构造算法的基础上,提出了基于时间和引用的启发式方法来构造会话。 相似文献
20.
Web日志挖掘中数据预处理方法的研究 总被引:2,自引:0,他引:2
Web日志挖掘是目前网上智能信息检索和电子商务的主要研究课题之一。而数据预处理在Web日志挖掘中起着很重要的作用,直接影响日志挖掘的质量和结果。介绍了Web日志挖掘数据预处理过程,综述了国际上的研究现状,及流行的处理方法。针对预处理步骤中的用户会话识别和路径填充进行了相应的改进。根据评估会话构造方法的标准,通过实验对给出的新方法与其他方法进行了分析比较。 相似文献