首页 | 本学科首页   官方微博 | 高级检索  
     

因子分析在基于用户兴趣的Web文档聚类中的应用
引用本文:郭岩,白硕. 因子分析在基于用户兴趣的Web文档聚类中的应用[J]. 模式识别与人工智能, 2005, 18(1)
作者姓名:郭岩  白硕
作者单位:中国科学院计算技术研究所,软件研究室,北京,100080;中国科学院研究生院,北京,100039;中国科学院计算技术研究所,软件研究室,北京,100080
基金项目:中国科学院计算技术研究所资助项目
摘    要:通过对实际Web访问日志的统计分析认为,在日志中用户的兴趣具有集中性,这说明用户由稳定兴趣驱动访问Web的频率远远高于偶然兴趣的驱动,因此一定时间段的Web访问日志中一定蕴含了用户的稳定兴趣.本文试图利用因子分析理论从用户访问频率矩阵中挖掘出用户的稳定兴趣因子,以此构造用户兴趣空间,并在用户兴趣空间中进行Web文档聚类.该用户兴趣空间突出了用户的共同兴趣,是一个正交空间.实验结果表明,用户兴趣空间中的Web文档聚类优于直接在用户访问频率矩阵(即用户空间)中的聚类.同时,空间的转换达到了数据压缩的效果.

关 键 词:Web日志挖掘  因子分析  聚类  用户兴趣空间

Using Gene-Analysis in Web-Document Clustering Based on Users' Interests
GUO Yan,Bai Shuo. Using Gene-Analysis in Web-Document Clustering Based on Users' Interests[J]. Pattern Recognition and Artificial Intelligence, 2005, 18(1)
Authors:GUO Yan  Bai Shuo
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号