首页 | 本学科首页   官方微博 | 高级检索  
     

基于Web页面结构和主色调的聚类算法
引用本文:赵涓涓,陈俊杰,李元俊.基于Web页面结构和主色调的聚类算法[J].计算机工程,2010,36(3):1-3.
作者姓名:赵涓涓  陈俊杰  李元俊
作者单位:太原理工大学计算机与软件学院,太原,030024
基金项目:国家自然科学基金资助项目(60773004);;山西省自然科学基金资助项目(2006011030,2007011050)
摘    要:针对目前Web聚类准确率不高的问题,提出一种基于Web页面链接结构和页面中图片主色调特征的聚类算法。通过分析Web页面中的链接结构和Web页面中所显示图片的主色调来比较页面之间的相似度,对Web站点中的Web页面进行聚类。聚类过程兼顾Web页面结构和页面的主要色彩特征。系统实验结果表明,该算法能有效提高聚类的准确性。

关 键 词:聚类  Web挖掘  链接结构  主色调

Clustering Algorithm Based on Web Pages Structure and Dominant Color
ZHAO Juan-juan,CHEN Jun-jie,LI Yuan-jun.Clustering Algorithm Based on Web Pages Structure and Dominant Color[J].Computer Engineering,2010,36(3):1-3.
Authors:ZHAO Juan-juan  CHEN Jun-jie  LI Yuan-jun
Affiliation:(College of Computer and Software, Taiyuan University of Technology, Taiyuan 030024)
Abstract:Aiming at the problem that the efficiency is low in Web clustering, this paper proposes a clustering algorithm based on linkage structure and the character of the dominant color on Web pages. It compares the similarity between Web pages by analyzing the linkage and the dominant color on them. It can cluster the Web pages on Web sites. In this procedure, the clustering has both the structure and the main character of tone. Experimental results of the system prove that it has made the clustering become more efficient and it has improved a lot than before.
Keywords:clustering  Web mining  linkage structure  dominant color
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号