首页 | 本学科首页   官方微博 | 高级检索  
     

基于平均词频的文本特征提取方法
引用本文:成松松,艾丽蓉. 基于平均词频的文本特征提取方法[J]. 计算机应用与软件, 2013, 0(10)
作者姓名:成松松  艾丽蓉
作者单位:西北工业大学计算机学院 陕西 西安710129
摘    要:文本分类中特征提取对分类效果有较大的影响,传统的特征提取方法在特征分布信息的量化方面存在不足。为此,提出一种基于特征词类内、类外平均词频的特征提取算法。算法通过特征词的平均词频类间集中度和文档频类间集中度来计算特征词的权重,能够更准确地反映特征词的分布情况。通过实验结果比较,可以证明,该算法有效地提高了分类效果。

关 键 词:文本分类  特征提取  平均词频  类间集中度

THE FEATURE EXTRACTION METHOD BASED ON AVERAGE WORD FREQUENCY
Cheng Songsong , Ai Lirong. THE FEATURE EXTRACTION METHOD BASED ON AVERAGE WORD FREQUENCY[J]. Computer Applications and Software, 2013, 0(10)
Authors:Cheng Songsong    Ai Lirong
Abstract:
Keywords:Text classification  Feature extraction  Average word frequency  Concentration between classes
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号