首页 | 本学科首页   官方微博 | 高级检索  
     

基于循环迭代算法改进的TFIDF方法及应用
作者姓名:王行恒  曹军  邓学  刘篧  高适
作者单位:1. 华东师范大学信息科学技术学院 上海200062
2. 上海外国语大学图书馆 上海200083
摘    要:文本聚类是指自动地将文本集合分组为不同的类别,应用非常广泛.研究发现,传统的TFIDF文本分类方法存在很多的不足,针对这些不足提出改进.通过使用循环迭代算法根据特征词在类内和类间的分布情况不断优化特征词的选取,获得不断改进的分类.采用支持向量机分类器对文本分类.通过对大批量的数据集测试,该算法显示出较好的特征选择效果,能够有效地提高分类精度.

关 键 词:TFIDF  文本聚类  文本分类  VSM  支持向量机  SVM  迭代算法
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号