首页 | 本学科首页   官方微博 | 高级检索  
     

强化类别贡献的文本特征权重方案
引用本文:平源,周亚建,张海滨,王枞,杨义先.强化类别贡献的文本特征权重方案[J].北京工业大学学报,2012,38(9):1389-1395.
作者姓名:平源  周亚建  张海滨  王枞  杨义先
作者单位:1. 北京邮电大学网络与信息攻防技术教育部重点实验室,北京100876 北京邮电大学灾备技术国家工程实验室,北京100876
2. 北京工业大学应用数理学院,北京,100124
基金项目:国家“863”计划资助项目,国家自然科学基金资助项目
摘    要:为使文本向量能准确表达文本信息、提升文本分类效果,提出了一种强化类别贡献的文本特征权重方案.利用后验概率定义了特征词的类别贡献度函数,结合相关频率权重因子,得到兼顾类别贡献度与类间分布差异的文本特征权重量化方案.在4个标准语料集上的测试结果表明,该方案实现简单,能更准确地刻画不同特征对分类的贡献差异,优化文本表示,并显著地提高文本分类效果.

关 键 词:文本表示  文本分类  相关频率  类别贡献度  支持向量机

Term Weighting Scheme With Enhanced Category Contribution for Text Categorization
PING Yuan,ZHOU Ya-jian,ZHANG Hai-bin,WANG Cong,YANG Yi-xian.Term Weighting Scheme With Enhanced Category Contribution for Text Categorization[J].Journal of Beijing Polytechnic University,2012,38(9):1389-1395.
Authors:PING Yuan  ZHOU Ya-jian  ZHANG Hai-bin  WANG Cong  YANG Yi-xian
Affiliation:1,2(1.Key Laboratory of Network and Information Attack and Defense Technology of Ministry of Education, Beijing University of Posts and Telecommunications,Beijing 100876,China; 2.National Engineering Laboratory for Disaster Backup and Recovery,Beijing University of Posts and Telecommunications, Beijing 100876,China;3.College of Applied Sciences,Beijing University of Technology,Beijing 100124,China)
Abstract:
Keywords:text representation  text categorization  relevance frequency  category contribution  supportvector machine
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号