首页 | 本学科首页   官方微博 | 高级检索  
     

CTM与SVM相结合的文本分类方法
引用本文:王燕霞,邓伟.CTM与SVM相结合的文本分类方法[J].计算机工程,2010,36(22):203-205.
作者姓名:王燕霞  邓伟
作者单位:(苏州大学计算机科学与技术学院,江苏 苏州 215006)
摘    要:研究一种相关主题模型(CTM)与支持向量机(SVM)相结合的文本分类方法。该方法用CTM对数据集建模以降低数据的维度,用SVM对简化后的文本数据进行分类。为使CTM模型能够较好地对数据集进行建模,在该方法中用DBSCAN聚类方法对数据进行聚类,根据聚类所得到的聚类中心点数目确定CTM模型的主题参数。实验结果表明,该方法可以加快分类速度并提高分类精度。

关 键 词:文本分类  相关主题模型  聚类  支持向量机

Text Classification Method Combining CTM and SVM
WANG Yan-xia,DENG Wei.Text Classification Method Combining CTM and SVM[J].Computer Engineering,2010,36(22):203-205.
Authors:WANG Yan-xia  DENG Wei
Affiliation:(School of Computer Science and Technology, Soochow University, Suzhou 215006, China)
Abstract:A text classification method combining Correlated Topic Model(CTM) and Support Vector Machine(SVM) is proposed. In order to reduce the corpus's dimension, this method models the corpus, and classifies the simplified text date with SVM. With the aim of making the CTM model the corpus better, DBSCAN clustering method is used and chooses the cluster number as the model topic parameter of CTM. Experimental result shows that the method can accelerate the classification speed and improve the classification accuracy.
Keywords:text classification  Correlated Topic Model(CTM)  clustering  SVM
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号