首页 | 本学科首页   官方微博 | 高级检索  
     

一种新的Web用户群体和URL聚类算法的研究
引用本文:宋江春,沈钧毅. 一种新的Web用户群体和URL聚类算法的研究[J]. 控制与决策, 2007, 22(3): 284-288
作者姓名:宋江春  沈钧毅
作者单位:西安交通大学,电子与信息工程学院,西安,710049;西安交通大学,电子与信息工程学院,西安,710049
基金项目:国家自然科学基金项目(60173058).
摘    要:提出一个基于Web日志的web用户群体和站点URL聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类.由于在聚类过程中同时考虑了用户对URL的浏览时间和访问次数,使算法的精度和效率都大大提高.同时,该算法能较好地处理类间重叠问题,使算法具有较好的实用性.最后对算法的有效性和可伸缩性进行了研究.

关 键 词:Web使用挖掘  用户浏览模式  用户访问矩阵  用户事务聚类  站点URL聚类
文章编号:1001-0920(2007)03-0284-05
收稿时间:2005-11-28
修稿时间:2006-02-03

Research on a new clustering algorithm of Web user communities and Web site's URLs
SONG Jiang-chun,SHEN Jun-yi. Research on a new clustering algorithm of Web user communities and Web site's URLs[J]. Control and Decision, 2007, 22(3): 284-288
Authors:SONG Jiang-chun  SHEN Jun-yi
Abstract:By using new methods which are based on Web user's browsing behavior characterization and user's viewing time discretization, a new clustering algorithm for Web user communities and Web site's URLs is proposed.Web user access matrixes are set up on the preparation of Web logs.By considering user's viewing time and number of hits to Web site's URLs simultaneously,the accuracy and efficiency of the clustering algorithm are increased.The improved algorithm could solve the problem of the partial overlap bewteen clusters,which makes the algorithm more practical.The effectiveness and the scalability of the algorithm are studied through the experiments.
Keywords:Web usage mining   User browsing pattern   User access matrix   User session clustering   Web site URL clustering
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《控制与决策》浏览原始摘要信息
点击此处可从《控制与决策》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号