首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
用户对Web网站访问兴趣可以通过页面的浏览顺序表现出来,Web站点的访问日志记录了用户访问页面的详细信息.介绍Web站点访问日志挖掘的相关知识,并定义新的兴趣度,相似度和聚类中心,提出了一种基于用户访问兴趣的路径聚类算法,最后通过实验来验证这种算法的有效性.  相似文献   

2.
基于用户会话的页面聚类算法旨在发现用户在浏览过程中频繁访问的页组,为站点管理员优化站点结构提供有力的依据。将介绍一种改进的基于频繁访问页组的路径聚类算法K-PathPlus,其中定义了新的兴趣度、内容链接因子。最后采用龙城热线网站日志进行真实测试,实验的结果是成功的。  相似文献   

3.
基于路径聚类的页面访问次序的挖掘   总被引:1,自引:0,他引:1  
为了发现用户的行为模式以实现Web站点的结构优化,提出了基于用户访问路径的K-PathSearch算法.在对网页实施预处理后,结合页面链接参数,建立用户访问事务处理模型,形成有用数据集.提取样本分析用户的兴趣度,主要影响因素体现在访问次序、次数以及停留时间三方面,并利用重新定义的相似度将兴趣取向相类似的用户划分为一类;在此基础上,定义用户访问最长拟合路径,进而计算路径聚类中心.经计算,聚类数和聚类中心平均长度增比显著,表明模型和算法是可行和有效的.  相似文献   

4.
权值矩阵聚类算法   总被引:1,自引:1,他引:0  
由于以往的算法不能对用户感兴趣的页面进行很好的聚类.所以将网站访问频度作为参数考虑进来,提出一个新的概念--权值关联矩阵,以Web服务器URL为行、以UserID为列建立URL-UserID关联矩阵,与普通的矩阵聚类算法相比,根据用户对某页面的兴趣度,再生成权值关联矩阵.从而发现相似的用户群体和相似的web页面.该算法通过上机实践,与传统的矩阵聚类算法相比具有识别准确率高,用户向量特征描述更准确,且能够更准确的反映网站的访问情况等优点.同时为用户提供个性化推荐服务铺平了道路.  相似文献   

5.
一种基于路径聚类的Web用户访问模式发现算法   总被引:7,自引:0,他引:7  
本文在将用户对Web站点访问行为表示成用户访问事务基础上,给出有关兴趣度、相似度、聚类中心定义,提出基于ISODATA算法的路径聚类方法,并对实际网站Web日志文件进行实验,结果表明该方法不但能够发现群体用户访问模式。而且还得到较为合理的模式聚类个数。  相似文献   

6.
电子商务网站包含相当大的用户访问信息,对用户信息的数据挖掘,可以加强网站对用户访问信息的准确了解,提高电子商务网站的点击率。为此将提取电子商务网站日志中记录的用户访问链接数据,利用去噪技术对用户访问链接日志记录数据进行过滤分析,将过滤后的用户访问数据利用相异度二元关系组成二元数组,通过对二元数组的相异度分析计算,可实现电商务网站用户的聚类,为网站页面的优化及访问用户的兴趣、爱好的掌握提供参考。  相似文献   

7.
Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提。通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用户访问页面频度。在这些数据准备工作的基础上,构造了用户一页面关联矩阵,作为改进的模糊C均值聚类算法的输入,实现了相似用户及相关页面的聚类。实验表明改进的FCM算法的有效性。  相似文献   

8.
沈洁  林颖  陈志敏  赵敏涯 《计算机应用》2005,25(7):1654-1657
提出一种新的用户访问模式增量式聚类算法:首先引入一种新的用户兴趣表示方法构造用户访问特征对象,再基于蚁群聚类的基本思想,利用人工蚂蚁依相邻区域对象相似性拾起或放下对象实现聚类;然后使用一种类解体机制,随着用户兴趣度的变化而形成新的类别,从而实现增量式聚类更新发现用户新的访问兴趣。实验结果表明,该方法能动态有效地实现增量式聚类。  相似文献   

9.
针对以往个性化网站实时推荐系统存在很难预测用户未来浏览页面的不足,提出了一个混合型的实时推荐模型。该模型将动态模糊聚类技术和改进的关联规则相结合,既挖掘用户与页面的相似度权值形成知识库,又考虑用户的访问事务集增量构造访问模式树,通过修剪其相关分枝,快速生成候选推荐集,由推荐引擎附加在请求页面的底部,在不干扰用户的访问同时,又将用户感兴趣的内容推荐给用户。实验结果表明,该方法能有效地提高推荐的精确率和覆盖率以及综合评价指标。  相似文献   

10.
路径聚类:在Web站点中的知识发现   总被引:41,自引:0,他引:41  
用户对Web站点的访问代表了用对Web站点上页面的访问兴越,这种兴越程序可以通过用户对Web站点上页面的浏览顺序表现出来,在对Web站点的记问日志进行事务识别后,可以根据群体用户对Web站点的访问顺序进行聚类,即路径聚类,那么最终每一个聚类集就反映出该聚类集中的全体用户具有相似的访问兴越,为了得到这种根据用户访问兴越而对用户集的划分,提出了K-paths路径聚类方法,在这种方法中,根据用户的访问兴越定义了新的相似性测量手段和聚类中心,实验的结果是成功的。  相似文献   

11.
郭孝园  何臻 《工矿自动化》2012,38(8):100-104
为了解决煤矿企业网站用户查找信息难的问题,提出了一种基于Web日志的煤矿企业网站个性化推荐服务模型。该模型应用关联规则对新用户进行页面推荐,应用聚类算法对老用户进行页面推荐;并结合点击网页的次数、网页的浏览时间、雅可系数与最长公共路径系数来度量用户兴趣度的方法,可为用户准确地推荐其感兴趣的页面。测试结果表明,该模型能够有效地对网页资源进行分类并进行个性化推荐。  相似文献   

12.
在Web使用挖掘中,用户浏览模式的聚类结果有助于网站设计者理解Web用户的浏览特点和需要。设计了一种有效的Web浏览模式的聚类方法,网页是否被浏览及网页上的浏览时间反映了用户的浏览兴趣,它们被刻画成等长的用户浏览模式向量中的相应分量,此外,浏览模式之间的关系被刻画并被作为属性加入到该向量中,形成扩展的用户浏览模式向量,对这些向量使用粗糙k-均值法可对用户浏览模式进行有效的聚类。实例和实验分析说明,使用该方法的聚类结果更合理。聚类结果可用于个性化网站的设计。  相似文献   

13.
夏斌  徐彬 《电脑开发与应用》2007,20(5):16-17,20
针对目前搜索引擎返回候选信息过多从而使用户不能准确查找与主题有关结果的问题,提出了基于超链接信息的搜索引擎检索结果聚类方法,通过对网页的超链接锚文档和网页文档内容挖掘,最终将网页聚成不同的子类别。这种方法在依据网页内容进行聚类的同时,充分利用了Web结构和超链接信息,比传统的结构挖掘方法更能体现网站文档的内容特点,从而提高了聚类的准确性。  相似文献   

14.
在入侵检测中对用户进行聚类,可以改善安全分析的效率,有助于发现潜在非法用户.在聚类中提出按照访问兴趣对用户进行聚类分析,在用户访问兴趣度量中综合考虑网页内容和浏览路径因素.在聚类分析中,依据访问兴趣定义提出新的相似度计算方法.利用传递闭包法对用户进行聚类.算法可以提高用户聚类的准确性,试验结果表明该算法是有效的.  相似文献   

15.
多尺度聚类挖掘在指导人们进行多尺度决策方面有着不可取代的作用,然而传统的多尺度聚类挖掘算法有一个致命的弱点,即需要在每个用户感兴趣的尺度上应用聚类挖掘算法.为克服此缺陷,定义了一种将数据的多尺度特性进行向量化的方法;结合地学领域的尺度转换机制,提出了一种新的知识的多尺度转换机制——基于加权向量提升的多尺度聚类挖掘算法WVB-MSCA(Weight Vector Based Multi-scale Clustering Algorithm).算法首先在选定的基准尺度上进行聚类挖掘,获取聚类结果,并借助尺度转换机制将基准尺度的聚类结果反演到其它感兴趣的尺度上.实验表明,算法WVB-MSCA是可行且有效的.  相似文献   

16.
Time-Aware Web Users' Clustering   总被引:1,自引:0,他引:1  
Web users' clustering is a crucial task for mining information related to users' needs and preferences. Up to now, popular clustering approaches build clusters based on usage patterns derived from users' page preferences. This paper emphasizes the need to discover similarities in users' accessing behavior with respect to the time locality of their navigational acts. In this context, we present two time-aware clustering approaches for tuning and binding the page and time visiting criteria. The two tracks of the proposed algorithms define clusters with users that show similar visiting behavior at the same time period, by varying the priority given to page or time visiting. The proposed algorithms are evaluated using both synthetic and real data sets and the experimentation has shown that the new clustering schemes result in enriched clusters compared to those created by the conventional non-time-aware user clustering approaches. These clusters contain users exhibiting similar access behavior in terms not only of their page preferences but also of their access time.  相似文献   

17.
基于归纳化会话的网络用户的聚类   总被引:7,自引:0,他引:7  
为了发掘具有相似的访问兴趣的网络用户,探讨了网络用户聚类的问题。网络用户的访问信息从服务器日志文件中抽取出来,组织成会话向量的形式,会话描述为一段时间内用户向服务器发出一系列访问请求。为了减少会话向量的维度,根据网页的层次性,采用面向属性的推理方法,对这些会话进行了归纳,并且定义了一个新的距离测度来描述两个会话之间的相似度,最后采用某种非欧几里德的关系聚类算法聚类这些归纳化的会话。实验表明,这种方法对在大型的日志文件集中挖掘出有意义的网络用户的分类是高效可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号