首页 | 本学科首页   官方微博 | 高级检索  
     

Web日志数据挖掘模型研究
引用本文:冯凌,林杰,雷星晖.Web日志数据挖掘模型研究[J].计算机集成制造系统,2005,11(8):1073-1076.
作者姓名:冯凌  林杰  雷星晖
作者单位:同济大学,经济与管理学院,上海,200092;同济大学,经济与管理学院,上海,200092;同济大学,经济与管理学院,上海,200092
基金项目:国家863/CIMS主题资助项目(2002AA413410),上海市科委重点项目(04JC14073)。~~
摘    要:利用web日志,通过网页编码和会话抽取计算页面相关度矩阵;通过聚类分析,得到了各类用户访问各网页的概率向量;利用网页相关度矩阵修正概率向量,得到了反映网页相关性和用户特征聚类的挖掘模型。实验数据表明,该模型挖掘出的用户访问特征具有较长的使用有效期。

关 键 词:Web使用挖掘  点击流  聚类分析
文章编号:1006-5911(2005)08-1073-03
修稿时间:2004年7月8日

Research on Web log data mining model
Feng Ling,LIN Jie,Lei Xing-hui.Research on Web log data mining model[J].Computer Integrated Manufacturing Systems,2005,11(8):1073-1076.
Authors:Feng Ling  LIN Jie  Lei Xing-hui
Abstract:By assigning each webpage a unique number, extracting session from Web log, calculating webpage similarity matrix,and getting user access probability vectors through clustering analysis, the web mining model could then be obtained by using the webpage similarity matrix to modify the probability vectors. The mining result was an integration of page similarity and user clustering profiles. Experimental data indicated that the model could better reflect user access characteristics.
Keywords:usage mining  click stream  clustering analysis
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号