首页 | 本学科首页   官方微博 | 高级检索  
     

基于K-中心点聚类算法的论坛信息识别技术研究
引用本文:王燕,吴灏,毛天宇.基于K-中心点聚类算法的论坛信息识别技术研究[J].计算机工程与设计,2009,30(1).
作者姓名:王燕  吴灏  毛天宇
作者单位:解放军信息工程大学信息工程学院,河南,郑州,450002
摘    要:提出了一种从非确定结构的论坛页面自动获取信息区域的方法.该方法在对K-中心点聚类算法的研究基础上克服了算法中固定簇数的缺陷,并在算法的簇中心距离计算中引入Smith-Waterman改进算法,提高了算法聚类的精确度.通过对大量论坛网页进行信息识别的实验显示,该方法切实可行并且具有较高的准确性.

关 键 词:标签结构树  K-中心点聚类算法  Smith-Waterman算法  最小相异度  信息识别

Research on web forums information recognition based on K-Medoids clustering
WANG Yan,WU Hao,MAO Tian-yu.Research on web forums information recognition based on K-Medoids clustering[J].Computer Engineering and Design,2009,30(1).
Authors:WANG Yan  WU Hao  MAO Tian-yu
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号