首页 | 本学科首页   官方微博 | 高级检索  
     

基于Web页面链接和标签的聚类方法
引用本文:李元俊,陈俊杰,赵涓涓.基于Web页面链接和标签的聚类方法[J].计算机工程与设计,2009,30(18).
作者姓名:李元俊  陈俊杰  赵涓涓
作者单位:太原理工大学,计算机与软件学院,山西,太原,030024
基金项目:国家自然科学基金项目,山西省自然科学基金项目,山西省自然科学基金项目 
摘    要:针对目前Web聚类效率和准确率不高的问题,提出一种基于Web页面链接结构和标签信息的聚类方法CWPBLT(clustering web pages based on their links and tags),它是通过分析Web页面中的链接结构和重要标签信息来比较页面之间的相似度,从而对Web站点中的Web页面进行聚类,聚类过程同时兼顾了Web页面结构和页面标签提供的内容信息.实验结果表明,该方法有效地提高了聚类的时间效率和准确性,是对以往仅基于页面主题内容或页面结构聚类方法的改进.

关 键 词:聚类  Web挖掘  分装器  最小描述长度  链接结构

Clustering web pages based on their links and tags
LI Yuan-jun,CHEN Jun-jie,ZHAO Juan-juan.Clustering web pages based on their links and tags[J].Computer Engineering and Design,2009,30(18).
Authors:LI Yuan-jun  CHEN Jun-jie  ZHAO Juan-juan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号