首页 | 本学科首页   官方微博 | 高级检索  
     

一种词频与方差相结合的特征加权方法
作者姓名:邱云飞  王威  刘大有  邵良杉
作者单位:1. 辽宁工程技术大学 软件学院,辽宁 葫芦岛 125105;吉林大学 计算机科学与技术学院,长春 130012
2. 辽宁工程技术大学 软件学院,辽宁 葫芦岛,125105
3. 吉林大学 计算机科学与技术学院,长春,130012
基金项目:国家自然科学基金资助项目(70971059);辽宁省创新团队项目(2009T045)
摘    要:通过分析特征词与类别间的相关性,提出了一种新的特征加权方法,依据特征词在特定类中出现的次数、特征词在某一类中的集中程度、特征词在特定类中的均匀分布程度来计算特征权值。通过与TF-IDF进行实验对比,新提出的TF-Var特征权重方法使得分类的微平均准确率得到了明显的提高。

关 键 词:文本分类  特征权重  词频  方差
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号