首页 | 本学科首页   官方微博 | 高级检索  
     

K-NN与SVM相融合的文本分类技术研究
引用本文:王强,王晓龙,关毅,徐志明. K-NN与SVM相融合的文本分类技术研究[J]. 高技术通讯, 2005, 15(5): 19-24
作者姓名:王强  王晓龙  关毅  徐志明
作者单位:哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001;哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001;哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001;哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001
基金项目:国家自然科学基金 (60 43 5 0 2 0 ),863计划 (2 0 0 2AA1170 10 0 9)资助项目
摘    要:提出了一种改进的K-NN(K Nearest Neighbor)与SVM(Support Vector Machine)相融合的文本分类算法。该算法利用文本聚类描述K-NN算法中文本类别的内部结构,用sigmoid函数对SVM输出结果进行概率转换,同时引入CLA(Classifier’s Local Accuracy)技术进行分类可信度分析以实现两种算法的融合。实验表明该算法综合了K-NN与SVM在分类问题中的优势,既有效地降低了分类候选的数目,又相应地提高了文本分类的精度,具有较好的性能。

关 键 词:KNN  文本聚类  SVM  Sigmoid  CLA

A research on text categorization based on the fusion of K-NN and SVM
Wang Qiang,Wang XiaoLong,Guan Yi,XU Zhiming. A research on text categorization based on the fusion of K-NN and SVM[J]. High Technology Letters, 2005, 15(5): 19-24
Authors:Wang Qiang  Wang XiaoLong  Guan Yi  XU Zhiming
Abstract:This paper presents a new fusion algorithm for automatic text categorization based on the combination of the improved K-NN and SVM. The new algorithm analyses the reliability of classifier with CLA (Classifier's Local Accuracy) technique for the combination of these two methods.The improved K-NN introduces text cluster to describe inside text structure and the improved SVM uses sigmoid function to transform the output of SVM to a probability value. The experimental results prove that the new algorithm combines the merits of the two algorithms and performs better with fewer candidates and higher precision.
Keywords:KNN   text clustering   SVM   Sigmoid   CLA
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号