首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于容错粗糙集的Web文档分类方法
引用本文:胡和平,易高翔. 一种基于容错粗糙集的Web文档分类方法[J]. 小型微型计算机系统, 2006, 27(2): 305-307
作者姓名:胡和平  易高翔
作者单位:华中科技大学,计算机科学与技术学院,湖北,武汉,430074
摘    要:为了充分利用Web这一宝贵资源,需要一种高效准确的Web分类方法.应用机器学习技术,如K-邻近法、贝叶斯概率模型等已经实现了Web文档半自动和自动分类,但是,大多数Web分类方法共同的特点是把类作为互斥的概念,很少考虑类与类之间存在一定的交叉概念.其实,一个Web文档有时可属于几个类别,说明web文档的类之间存在不确定的关系.粗糙集理论-l982年Pawlak提出的,它在不确定关系表示有显著优点.由近似关系产生的分类方法分类精度更高.在web文档常用向量模型基础上,利用特征词协同出现的价值,本文采用一种广义粗糙集……容错关系(tolerance relation)来表示文档,丰富特征词对Web文档的描述,实验结果表明它更适合表示Web文档,有利于提高Web分类的准确性.

关 键 词:Web分类  粗糙集  容错粗糙集  容错类
文章编号:1000-1220(2006)02-0305-03
收稿时间:2004-09-24
修稿时间:2004-09-24

Web Classification Based on Tolerance Rough Set
HU He-ping,YI Gao-xiang. Web Classification Based on Tolerance Rough Set[J]. Mini-micro Systems, 2006, 27(2): 305-307
Authors:HU He-ping  YI Gao-xiang
Abstract:
Keywords:Web classification   rough set   tolerance rough set   tolerance relation
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号