首页 | 本学科首页   官方微博 | 高级检索  
     

基于类别概念的特征选择方法
引用本文:王琳,陈伟萍,封化民,方勇,杨鼎才. 基于类别概念的特征选择方法[J]. 北京电子科技学院学报, 2006, 14(2): 10-14
作者姓名:王琳  陈伟萍  封化民  方勇  杨鼎才
作者单位:北京邮电大学,电信工程学院,北京,100876;燕山大学,秦皇岛,066004;北京电子科技学院,信息安全与保密重点实验室,北京,100070;北京邮电大学,电信工程学院,北京,100876;北京电子科技学院,信息安全与保密重点实验室,北京,100070
基金项目:国家自然科学基金 , 北京电子科技学院校科研和教改项目
摘    要:基于中文文本分类的定义和向量空间模型,本文分析了正确分类文本的关键所在.通过对传统的特征选择方法的分析,提出了新的特征选择方法.通过支撑向量机对中等规模语料库的实验,验证了此方法的有效性.

关 键 词:文本分类  向量空间模型  知网  类别概念
文章编号:1672-464X(2006)02-0010-05
收稿时间:2006-01-10
修稿时间:2006-01-10

Feature Selection Method Based on Category Concept
WANG Lin,CHEN Wei-ping,FENG Hua-min,FANG Yong,YANG Ding-cai. Feature Selection Method Based on Category Concept[J]. Journal of Beijing Electronic Science & Technology Institute, 2006, 14(2): 10-14
Authors:WANG Lin  CHEN Wei-ping  FENG Hua-min  FANG Yong  YANG Ding-cai
Affiliation:1.School of Telecommunication Engineering, Beiiing Universily of Post and Telecommunications, Beiiing 100876 China; 2.School of Information Engineering, YonShon Universily, Qinhuongdoo 066004 China; 3.Key Laboratory for Securily end Secrecy of Information, Beiiing Electronic Science end Technology Institute, Beijing 100070 China
Abstract:Based on the definition of text categorization and VSM (Vector Space Model), this paper analyzes the key points of correctly categorizing texts. After analyzing the conventional feature selection methods, a new feature selection method was proposed. Experiment result on a mid-size corpus With Support Vector Machine shows the effectiveness of the method.
Keywords:Text Categorization   VSM model   HowNet   Category Concept.
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号