首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于粒度原理的多指标综合Web用户聚类算法*
引用本文:赵洁,董振宁,张沙清,肖南峰.一种基于粒度原理的多指标综合Web用户聚类算法*[J].计算机应用研究,2011,28(7):2427-2431.
作者姓名:赵洁  董振宁  张沙清  肖南峰
作者单位:1. 广东工业大学管理学院,广州510520;华南理工大学计算机科学与工程学院,广州510641
2. 华南理工大学计算机科学与工程学院,广州,510641
基金项目:国家自然科学基金资助项目(70971027);国家教育部人文社会科学研究青年基金资助项目(10YJCZH234);广东高校优秀青年创新人才培养计划(育苗工程)项目(LYM09067);广东工业大学博士启动基金资助项目(103055);广东省哲学社会科学“十一五”规划项目(07SJY020);广东省软科学研究项目(2008B070800092);广东省大学生创新实验项目(1184510162,1184510166)
摘    要:为了解决传统聚类算法难以获得较好的Web用户聚类结果、使用的指标无法全面反映用户行为特征的问题,提出一种基于粒度原理的Web用户聚类算法。首先对离散化数据给出稀疏相似度和初始等价关系的定义,进行初次聚类;然后设计可变精度的二次聚类模型对初始聚类结果进行修正;最后结合应用领域定义一种新的聚类质量评价模型。算法中面向Web用户引入多指标体系,各种指标既可独立考核,也可灵活组合,并同时兼顾决策者对指标的偏好。实验证明,该算法适用于Web用户的高维稀疏数据,不依赖样本的顺序,具有更广应用性,可提供多粒度分析结果,得到的聚类结果能真实反映数据的特征。

关 键 词:Web使用挖掘  粒度原理  高属性维稀疏数据  多指标  聚类质量评价

Granular principle based multi-index synthetical Web user clustering algorithm
ZHAO Jie,DONG Zhen-ning,ZHANG Sha-qing,XIAO Nan-feng.Granular principle based multi-index synthetical Web user clustering algorithm[J].Application Research of Computers,2011,28(7):2427-2431.
Authors:ZHAO Jie  DONG Zhen-ning  ZHANG Sha-qing  XIAO Nan-feng
Affiliation:ZHAO Jie1,2,DONG Zhen-ning1,ZHANG Sha-qing1,XIAO Nan-feng2(1.School of Management,Guangdong University of Technology,Guangzhou 510520,China,2.School of Computer Science & Engineering,South China University of Technology,Guangzhou 510641,China)
Abstract:To solve the problems of that the traditional clustering algorithm was hard to obtain ideal result of Web user,and the indexes of current algorithms could't reflect user behavioral characteristic,this paper proposed a granular principle based clustering algorithm.It discretized the sparse data through a semi-fuzzy algorithm.Based on these,defined sparse similarity and initial equivalence relation on discrete data and designed variable precision quadratic clustering model to refine the result so the algorith...
Keywords:Web usage mining  granular principle  high attribute dimensional sparse data  multi-index  clustering quality evaluation  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号