首页 | 本学科首页   官方微博 | 高级检索  
     

Web文本聚类算法的分析比较
引用本文:许芳芳,王新伟.Web文本聚类算法的分析比较[J].计算机时代,2010(10):6-9.
作者姓名:许芳芳  王新伟
作者单位:1. 华东师范大学计算机科学与技术系,上海,200062;池州学院数学计算机科学系
2. 华东师范大学计算机科学与技术系,上海,200062
摘    要:随着计算机网络的发展,各种文本资源以惊人的速度增长,导致信息搜寻困难和信息利用率低下。而快速高质量的Web文本聚类技术可以满足用户方便快捷地从互联网获得所需要的信息资源。文章对Web文本聚类如网页采集、去噪、分词、特征表示等关键技术进行研究,对常用的Web文本聚类算法进行了分析比较,所给出的分析比较结果对文本聚类算法的应用有现实意义。

关 键 词:文本挖掘  Web文本聚类  Web文本预处理  聚类算法

Analysis and Comparison of Web Text Clustering Algorithm
XU Fang-fang,WANG Xin-wei.Analysis and Comparison of Web Text Clustering Algorithm[J].Computer Era,2010(10):6-9.
Authors:XU Fang-fang  WANG Xin-wei
Affiliation:1.1.Dept.of Computer Science and Technology,East China Normal University,Shanghai 200062,China;2.Dept.of Mathematics and Computer Science,Chizhou University)
Abstract:With the development of computer network,various text resources are growing at an amazing speed,which results in difficult information search and low information utilization.The fast high-quality Web text clustering technology can help users obtain required information resource on Internet conveniently and quickly.This paper researches the key Web text clustering technologies such as webpage gathering,de-noising,word segmenting and feature expression,analyzes and compares common Web text clustering algorithms,which has practical significance for the application of text clustering algorithm.
Keywords:text mining  Web text clustering  Web text preprocessing  clustering algorithm
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号