首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于特征提取的二级文本分类方法
引用本文:邹丽娜,凌捷.一种基于特征提取的二级文本分类方法[J].广东工业大学学报,2012(4):65-68.
作者姓名:邹丽娜  凌捷
作者单位:广东工业大学计算机学院
基金项目:广东省教育部产学研合作资助项目(2011A090200068);广东省自然科学基金资助项目(9151009001000043)
摘    要:提出了一种改进的基于特征提取的二级文本分类方法.通过提取出文本的特征项并计算其权重值,将文本表示成由特征项和权重值组成的向量,利用向量的夹角余弦计算二级分类模型下文本之间的相似度,可以更准确快速地定位海量信息.实验结果表明本文提出的分类方法的准确率优于传统的类中心分类法,提高了系统的适应性和分类能力.

关 键 词:文本分类  特征提取  向量空间模型  KNN算法

A Two-level Text Classification Based on Feature Extraction
Zou Li-na,Ling Jie.A Two-level Text Classification Based on Feature Extraction[J].Journal of Guangdong University of Technology,2012(4):65-68.
Authors:Zou Li-na  Ling Jie
Affiliation:(School of Computer Science,Guangdong University of Technology,Guangzhou 510006,China)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号