首页 | 本学科首页   官方微博 | 高级检索  
     

一种快速网页检索结果聚类策略
引用本文:高镔.一种快速网页检索结果聚类策略[J].计算机工程与应用,2011,47(12):110-112.
作者姓名:高镔
作者单位:黑龙江大学 信息科学与技术学院,哈尔滨 150080
基金项目:国家自然科学基金,黑龙江大学校青年自然科学基金
摘    要:在网页聚类中,HAC(Hierarchical Agglomerative Clustering)算法和K-means算法都是经常用到的。但它们都有各自的不足。提出一种两阶段聚类方法。第一阶段利用HAC聚类算法对网络检索结果的标题进行聚类,第二阶段以第一阶段结果作为初始中心用K-means算法聚类标题和摘要取得比较合理的聚类结果。由于标题一般都比较短,可以大大减少HAC算法的运行时间。这样既满足网络检索对时间的要求又可以得到较好的聚类结果。

关 键 词:网页检索结果聚类  层次聚类  两阶段聚类  
修稿时间: 

Fast clustering strategy for web search result
GAO Bin.Fast clustering strategy for web search result[J].Computer Engineering and Applications,2011,47(12):110-112.
Authors:GAO Bin
Affiliation:College of Information Science and Technology,Heilongjiang University,Harbin 150080,China
Abstract:In web search result clustering, HAC(Hierarchical Agglomerative Clustering) and K-means are usually used.But each of them has its own fault.This paper advances a two-stage clustering method.In the first stage, it clusters the topics by HAC, in the second stage, it clusters the topics and abstracts by K-means with the initial cluster center from the first stage clustering to get a reasonable clustering result.Because the topics are always short,the running time of HAC is greatly shorter.This method satisfies the need of time to web search and gets a better clustering result.
Keywords:web search result clustering  hierarchical clustering  two-stage clustering method
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号