首页 | 本学科首页   官方微博 | 高级检索  
     

中文文本体裁分类中特征选择的研究
引用本文:邓琦,苏一丹,曹波,闭剑婷.中文文本体裁分类中特征选择的研究[J].计算机工程,2008,34(23):89-91.
作者姓名:邓琦  苏一丹  曹波  闭剑婷
作者单位:广西大学计算机与电子信息学院,南宁,530004
基金项目:国家自然科学基金资助项目
摘    要:针对文本体裁自动分类在特征选择和权重计算方面的特殊性,提出文本的内容类别信息,改进传统特征选择方法CHI以及权重计算公式tf.idf,并运用支持向量机在含5类体裁的语料上进行中文文本体裁自动分类。实验结果表明,该方案是可行的。

关 键 词:中文信息处理  体裁分类  特征项选择  支持向量机
修稿时间: 

Research on Feature Selection in Chinese Text Genre Classification
DENG Qi,SU Yi-dan,CAO Bo,BI Jian-ting.Research on Feature Selection in Chinese Text Genre Classification[J].Computer Engineering,2008,34(23):89-91.
Authors:DENG Qi  SU Yi-dan  CAO Bo  BI Jian-ting
Affiliation:(College of Computer and Electronic Information, Guangxi University, Nanning 530004)
Abstract:Aiming at the particularity of text genre classification in feature selection and weight calculation, this paper presents the text content category information, which improves the conventional CHI feature selection method and the tf.idf formula of feature weight. By using Support Vector Machine(SVM), an automatic classification on a Chinese text corpus consisting of five genres is carried out. Experimental results show this scheme is feasible.
Keywords:Chinese information processing  genre classification  feature selection  Support Vector Machine(SVM)
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号