基于模糊粗糙集的Web文本分类 Web Document Classification Based on Fuzzy- Rough Set期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于模糊粗糙集的Web文本分类

引用本文：	孙海虹,丁华福.基于模糊粗糙集的Web文本分类[J].计算机技术与发展,2010,20(7):21-24.

作者姓名：	孙海虹丁华福

作者单位：	哈尔滨理工大学计算机科学与技术系,黑龙江,哈尔滨,150080

基金项目：	国家自然科学基金重点项目

摘要：	网络信息的多样性和多变性给信息的管理和过滤带来极大困难,为加快网络信息的分类速度和分类精度,提出了一种基于模糊粗糙集的Wdb文本分类方法.采用机器学习的方法:在训练阶段,首先对Web文本信息预处理,用向量空间模型表示文本,生成初始特征属性空间,并进行权值计算;然后用模糊粗糙集算法来进行信息过滤,用基于模糊租糙集的属性约简算法生成分类规则:最后利用知识库进行文档分类.在测试阶段,对未经预处理的文本直接进行关键属性匹配,经模糊粗糙因子加权后,用空间距离法分类.通过试验比较,该方法具有较好的分类效果.
关键词：	机器学习模糊粗糙集 Web文本分类属性约简
Web Document Classification Based on Fuzzy- Rough Set

SUN Hai-hong,DING Hua-fu.Web Document Classification Based on Fuzzy- Rough Set[J].Computer Technology and Development,2010,20(7):21-24.

Authors:	SUN Hai-hong DING Hua-fu

Abstract:

Keywords:
本文献已被维普万方数据等数据库收录！