首页 | 本学科首页   官方微博 | 高级检索  
     

基于交叉覆盖算法的文本分类
引用本文:王倩倩,段震,张燕平. 基于交叉覆盖算法的文本分类[J]. 计算机技术与发展, 2007, 17(6): 113-115
作者姓名:王倩倩  段震  张燕平
作者单位:安徽大学,计算智能与信号处理重点实验室,安徽,合肥,230039
基金项目:国家重点基础研究发展计划(973计划);国家自然科学基金;安徽省自然科学基金
摘    要:分类是文本信息搜索和挖掘的核心内容,被广泛应用于搜索引擎的设计以及数据挖掘的研究中。首先对文本进行分词,对分词的结果采用x2统计量的方法提取特征,再使用前向神经网络的交叉覆盖算法作为分类器进行文本分类。实验表明,x2统计量可大规模降低特征维数,在此基础上结合交叉覆盖算法的优秀分类能力,可在特征维数较低的情况下获得一个性能较好的文本分类器。

关 键 词:文本分类  x2统计量  交叉覆盖算法
文章编号:1673-629X(2007)06-0113-03
收稿时间:2006-08-08
修稿时间:2006-08-08

Text Classification Based on Cross Cover Algorithm
WANG Qian-qian,DUAN Zhen,ZHANG Yan-ping. Text Classification Based on Cross Cover Algorithm[J]. Computer Technology and Development, 2007, 17(6): 113-115
Authors:WANG Qian-qian  DUAN Zhen  ZHANG Yan-ping
Abstract:
Keywords:text classification   x^2 statistic   cross cover algorithm
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号