首页 | 本学科首页   官方微博 | 高级检索  
     

基于模糊粗糙集的Web文本分类
引用本文:孙海虹,丁华福. 基于模糊粗糙集的Web文本分类[J]. 计算机技术与发展, 2010, 20(7): 21-24
作者姓名:孙海虹  丁华福
作者单位:哈尔滨理工大学计算机科学与技术系,黑龙江,哈尔滨,150080
基金项目:国家自然科学基金重点项目 
摘    要:网络信息的多样性和多变性给信息的管理和过滤带来极大困难,为加快网络信息的分类速度和分类精度,提出了一种基于模糊粗糙集的Wdb文本分类方法.采用机器学习的方法:在训练阶段,首先对Web文本信息预处理,用向量空间模型表示文本,生成初始特征属性空间,并进行权值计算;然后用模糊粗糙集算法来进行信息过滤,用基于模糊租糙集的属性约简算法生成分类规则:最后利用知识库进行文档分类.在测试阶段,对未经预处理的文本直接进行关键属性匹配,经模糊粗糙因子加权后,用空间距离法分类.通过试验比较,该方法具有较好的分类效果.

关 键 词:机器学习  模糊粗糙集  Web文本分类  属性约简

Web Document Classification Based on Fuzzy- Rough Set
SUN Hai-hong,DING Hua-fu. Web Document Classification Based on Fuzzy- Rough Set[J]. Computer Technology and Development, 2010, 20(7): 21-24
Authors:SUN Hai-hong  DING Hua-fu
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号