首页 | 本学科首页   官方微博 | 高级检索  
     

融合LSI和支持向量聚类的网页文本分类算法*
引用本文:史长琼,黄辉,王大卫,姜腊林,扶宗文.融合LSI和支持向量聚类的网页文本分类算法*[J].计算机应用研究,2009,26(12):4523-4525.
作者姓名:史长琼  黄辉  王大卫  姜腊林  扶宗文
作者单位:1. 长沙理工大学,计算机与通信工程学院,长沙,410076;湖南大学,计算机与通信学院,长沙,410082
2. 长沙理工大学,计算机与通信工程学院,长沙,410076
基金项目:湖南省教育厅自然科学基金资助项目(06C111)
摘    要:特征选择和分类算法是网页文本聚类中最关键的技术。提出对网页文本提取特征值后,利用潜在语义索引对网页文本降维,采用支持向量聚类(SVC)算法对降维后的特征向量进行聚类,以此进行文本分类。实验结果显示具有较好的效果。

关 键 词:特征提取    潜在语义索引    网页文本    语义聚类    支持向量聚类

Web text classification algorithm fused LSI and SVC
SHI Chang-qiong,HUANG Hui,WANG Da-wei,JIANG La-lin,FU Zong-wen.Web text classification algorithm fused LSI and SVC[J].Application Research of Computers,2009,26(12):4523-4525.
Authors:SHI Chang-qiong  HUANG Hui  WANG Da-wei  JIANG La-lin  FU Zong-wen
Affiliation:(1.Institute of Computer & Communication Engineering, Changsha University of Science & Technology, Changsha 410076, China; 2.School of Computer & Communication, Hunan University, Changsha 410082, China)
Abstract:Feature extraction and clustering algorithm are the most crucial technologies for Web text clustering. This paper proposed that latent semantic indexing (LSI) was used for Web text dimension reduction and feature extraction, and then the processed results was clustered by support vector clustering (SVC). The experiment indicates that the method can get good results.
Keywords:feature extraction  latent semantic indexing(LSI)  Web text  semantic clustering  support vector clustering(SVC)
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号