首页 | 本学科首页   官方微博 | 高级检索  
     

一种有指导的文本特征加权改进算法
引用本文:刘端阳,陆洋. 一种有指导的文本特征加权改进算法[J]. 计算机工程, 2012, 38(8): 128-130
作者姓名:刘端阳  陆洋
作者单位:浙江工业大学计算机科学与技术学院,杭州,310023
基金项目:国家自然科学基金资助项目(EC0017540)
摘    要:传统tf.idf方法未利用分类数据的特性,无法反映词在各个类别之间的比例关系。为此,在分析有指导的文本特征加权方法tf.rf基础上,提出一种基于有指导的改进文本特征加权方法tf.ridf。该改进方法结合tf.idf和tf.rf 2种方法的特点,考虑词在总体文档及各类别文档之间的关系,实现文本特征加权。实验结果表明,该方法的分类能力比tf.rf方法有明显提升。

关 键 词:数据挖掘  文本分类  文本表示  特征加权  有指导方法  支持向量机
收稿时间:2011-09-12

Improved Supervised Algorithm of Text Feature Weighting
LIU Duan-yang , LU Yang. Improved Supervised Algorithm of Text Feature Weighting[J]. Computer Engineering, 2012, 38(8): 128-130
Authors:LIU Duan-yang    LU Yang
Affiliation:(College of Computer Science and Technology,Zhejiang University of Technology,Hangzhou 310023,China)
Abstract:The traditional tf.idf algorithm can not take full advantage of the characteristics of data set for classification,which can not reflect the relationship of the term among the classes.On the basis of analyzing the tf.rf which is a supervised text feature weighting method,this paper proposes an improved supervised algorithm of text feature weighting which is called tf.ridf.The algorithm combines the advantages of two ideas,considers the relationship of the term in the various categories and in the overall documents,implements text feature weighting.Experimental result shows that the classification accuracy of tf.ridf increases significantly higher than tf.rf.
Keywords:data mining  text categorization  text representation  feature weighting  supervised method  Support Vector Machine(SVM)
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号