共查询到16条相似文献,搜索用时 109 毫秒
1.
针对当前挖掘用户访问模式算法仅将频繁访问路径作为用户浏览兴趣路径的问题,依据使用Web日志挖掘用户兴趣页面时,通过引入页面信息量参数,综合考虑页面访问次数、浏览时间和页面信息量大小来定义用户兴趣度,提出了基于兴趣度的用户访问模式挖掘算法。实验证明该算法是有效的,在用户浏览兴趣度量方面比当前的频繁访问路径挖掘算法更准确。 相似文献
2.
3.
从Web日志中挖掘用户浏览偏爱路径 总被引:55,自引:0,他引:55
Web日志中包含了大量的用户浏览信息,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题.作者在分析目前用户浏览模式挖掘算法存在的问题的基础上,利用提出的支持一偏爱度的概念,设计了网站访问矩阵,并基于这个矩阵提出了用户浏览偏爱路径挖掘算法:先利用Web日志建立以引用网页URL为行、浏览网页URL为列、路径访问频度为元素值的网站访问矩阵.该矩阵为稀疏矩阵,将该矩阵用三元组法来进行表示.然后,通过对该矩阵进行支持一偏爱度计算得到偏爱子路径.最后进行合并生成浏览偏爱路径.实验表明该算法能准确地反映用户浏览兴趣,而且系统可扩展性较好.这可以应用于电子商务网站的站点优化和个性化服务等. 相似文献
4.
程苗 《计算机工程与应用》2011,47(29):85-89
从Web日志中挖掘用户浏览偏爱路径是一个重要的研究课题。目前的挖掘算法注重客观访问频度,忽略了用户对这一频繁访问路径是否感兴趣。在分析目前用户偏爱路径挖掘算法存在的问题的基础上,结合网站拓扑结构图修正基于频度的用户偏爱路径的衡量标准,提出了有用偏爱度的概念,从而剔除由于页面放置和链接等因素对挖掘的影响;针对目前基于单一节点的挖掘系统的计算能力不足的问题,利用云计算的分布式处理和虚拟化技术的优势,给出了一种基于云计算的数据处理方法,在此基础上挖掘用户浏览偏爱路径。实验表明,该算法针对大数据量的日志进行挖掘,准确率和效率比普通基于频度进行用户浏览偏爱路径挖掘的算法有所提高。 相似文献
5.
基于Web数据挖掘的用户浏览兴趣路径研究 总被引:1,自引:0,他引:1
使用Web日志与用户浏览行为相结合的方式对用户浏览兴趣模式进行挖掘。分别建立以访问次数、平均到网页中字符数的访问时间和拉动滑动条次数为元素值的矩阵,通过对矩阵进行路径兴趣度的计算得到兴趣子路径,进行合并生成用户兴趣路径集。实例分析表明该算法是可行和有效的,对于电子商务网站的优化和实施个性化服务具有意义。 相似文献
6.
在构建个性化服务中常常通过需要挖掘用户的浏览模式来改进站点的结构,使得客户访问站点变得容易。问题的关键就在于如何从Web日志中发现用户浏览模式。该文就此提出一种算法,通过为Web日志数据构造后缀树进行序列挖掘,找出最大频繁序列,进而发现有意义的浏览模式。该算法的重要特点是可以在线进行。 相似文献
7.
从Web日志中挖掘用户浏览兴趣路径,对于网站重构和产品推荐等商业用途具有重要意义。传统的挖掘算法一般基于用户访问频度,并不能真正体现用户的兴趣点。访问时间是一个能反应用户浏览兴趣的重要因素,用预设的访问时间阈值剔除无效数据,得出有效访问时间。本文对蚁群算法加以改进,用浏览频度和权值因子作为兴趣函数,有效访问时间因子作为信息素函数,提出有效-兴趣度的概念。对算法进行具体模拟,结果表明,本文提出的挖掘算法比传统的算法更能体现用户的浏览兴趣。 相似文献
8.
吴瑞 《小型微型计算机系统》2007,28(6):1098-1102
提出了使用语言最小支持度和偏爱度的web日志挖掘方法.表示用户兴趣和偏爱程度的支持度和偏爱度被刻画成相应的模糊语言变量,通过与最小语言支持度和偏爱度(模糊语言变量)比较,判定该网页是否是一个用户偏爱网页,这种语言的输入输出更自然更易理解.此外,网页上的浏览时间也是反映用户兴趣和偏爱的一个重要因素,它也被表示成相应的模糊语言变量,既体现不同网页浏览时间的不同,也可以忽略它们之间的细微差别.所获得的带有模糊时间的用户偏爱浏览路径更能反映用户的兴趣和偏爱性. 相似文献
9.
个性化推荐服务中用户兴趣模型研究 总被引:1,自引:0,他引:1
本文提出了一种利用用户浏览页面集的内容信息和浏览行为信息,隐式地创建用户兴趣描述文件的方法。通过对用户浏览的web页面进行兴趣度分析,并与对用户浏览网页时的浏览行为分析相合,得到了用特征矩阵表示的用户兴趣模型。并采用层次聚类算法和k-means聚类算法相结合的综合聚类算法进行聚类,得到用兴趣分类树表示的用户兴趣模型。由于采用的是隐式创建用户描述文件的方法,减少了因用户参于而带来的系统噪声,保证了所创建的用户兴趣模型的准确性。 相似文献
10.
聚类分析是Web日志挖掘系统的重要组件,聚类分析的质量决定挖掘结果的有效性.本文引入一种向量聚类方法,并针对原有方法的不足提出改进.首先分析用户事务求出用户事务的相似矩阵,通过分别计算用户事务相似度和用户浏览路径相似度,然后把两者平均得到不同用户事务之间的相似性系数,最后根据相似性系数方法得出聚类结果.这种算法考虑到了web用户访问的有序、连续、重复性,结果能够真正反映出用户的浏览兴趣. 相似文献
11.
针对二元的互关联后继树模型进行改进,构造三元互关联后继树,并结合Web日志的特点,构造Web事务集的互关联后继树和增量更新模型,设计基于三元互关联后继树的频繁路径挖掘算法,挖掘Web日志中的频繁路径。通过实验证明了基于三元互关联后继树和改进后的模型的出色插入查询性能。 相似文献
12.
Web日志中用户频繁路径快速挖掘算法 总被引:10,自引:0,他引:10
Web访问志中含有大量用户浏览信息,从中有效挖掘出用户频繁路径是建立自适用化网站的必要前提。该文在Apriori算法和有向图存储结构的基础上,提出了会话矩阵和遍历矩阵的概念,设计了用户频繁路径快速挖掘算法:首先利用会话矩阵筛选出满足一定阈值条件的频繁一项集,这样避免产生大量中间项;然后在相似客户群体内,对页面快速聚类,得到相关联页面;最后根据遍历矩阵对相关联页面进行路径合并,得出频繁路径。实验表明此算法的准确性和快速性。 相似文献
13.
基于Web日志挖掘用户的浏览兴趣路径 总被引:1,自引:0,他引:1
提出一种基于Web日志发现用户浏览偏爱路径算法。引入了支持-兴趣度概念。建立用户访问矩阵以表示用户浏览网页行为,并获得访问矩阵的海明距离矩阵。通过对距离矩阵与相似度阈值的计算获得偏爱路径的候选2项子路径,再利用支持-兴趣度对候选集做进一步的过滤,最后进行合并并生产浏览偏爱路径。实验表明该算法可以有效地反映用户的浏览兴趣。 相似文献
14.
15.
引入一种挖掘用户兴趣路径的算法,并对其进行有意义的改进。算法的主要思想是:首先利用Web日志建立以引用网页URL为行、浏览网页URL为列的两个网站访问矩阵,分别采用访问次数和平均到网页中字符数的访问时间为元素值。然后,通过对矩阵进行路径兴趣度计算得到兴趣子路径,最后进行合并生成用户兴趣路径集。 相似文献
16.
陈小莉 《数字社区&智能家居》2009,(10)
Web日志中包含了大量的用户浏览信息,对Web日志进行分析可以发现用户偏好路径容。本文提出了一种基于Web日志挖掘出用户浏览偏爱的路径,根据路径对应的文档内容提取用户偏爱的主题,并向用户推荐偏爱主题内容,从而为个性化学习服务。 相似文献