首页 | 本学科首页   官方微博 | 高级检索  
     

用于Web文档聚类的基于相似度的软聚类算法
引用本文:姜亚莉,关泽群.用于Web文档聚类的基于相似度的软聚类算法[J].计算机工程,2006,32(2):59-61.
作者姓名:姜亚莉  关泽群
作者单位:武汉大学遥感信息工程学院,武汉,430079
摘    要:提出了一种基于相似度的软聚类算法用于文本聚类,这是一种基于相似性度量的有效的软聚类算法,实验表明通过比较SISC和诸如K-mcans的硬聚类算法,SISC的聚类速度快、效率高。最后展望了文本挖掘在信息技术中的发展前景。

关 键 词:Web文本挖掘  文本聚类  软聚类  相似度
文章编号:1000-3428(2006)02-0059-03
收稿时间:2005-01-16
修稿时间:2005-01-16

A Similarity-based Soft Clustering Algorithm for Web Documents
JIANG Yali,GUAN Zequn.A Similarity-based Soft Clustering Algorithm for Web Documents[J].Computer Engineering,2006,32(2):59-61.
Authors:JIANG Yali  GUAN Zequn
Affiliation:School of Remote Sensing Information Engineering, Wuhan University, Wuhan 430079
Abstract:This paper proposes similarity-based soft clustering (SISC), an efficient soft clustering algorithm based on a given similarity measure used in document clustering. Comparison with existing hard clustering algorithms like K-means, the experiment indicates SISC is both efficient and effective, and this algorithm is available for document clustering. In the end, it highlights the upcoming challenges of document mining and the opportunities it offers.
Keywords:Web document mining  Document clustering  Soft clustering  Similarity
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号