首页 | 本学科首页   官方微博 | 高级检索  
     

不同程度的监督机制在自动文本分类中的应用
引用本文:丁磊,钱云涛.不同程度的监督机制在自动文本分类中的应用[J].计算机应用与软件,2004,21(6):65-68.
作者姓名:丁磊  钱云涛
作者单位:浙江大学计算机学院,杭州,310027
摘    要:自动文本分类技术涉及信息检索、模式识别及机器学习等领域。本文以监督的程度为线索,综述了分属全监督,非监督以及半监督学习策略的若干方法-NBC(Naive Bayes Classifier),FCM(Fuzzy C-Means),SOM(Self-Organizing Map),ssFCM(serni-supervised Fuzzy C-Means)gSOM(guided Self-Organizing Map),并应用于文本分类中。其中,gSOM是我们在SOM基础上发展得到的半监督形式。并以Reuters-21578为语料,研究了监督程度对分类效果的影响,从而提出了对实际文本分类工作的建议。

关 键 词:监督机制  自动文本分类技术  信息检索  模式识别  机器学习  半监督学习  非监督学习

APPLICATION OF DIFFERENT DEGREES OF SUPERVISION IN AUTOMATIC TEXT CATEGORIZATION
Ding Lei,Qian Yuntao.APPLICATION OF DIFFERENT DEGREES OF SUPERVISION IN AUTOMATIC TEXT CATEGORIZATION[J].Computer Applications and Software,2004,21(6):65-68.
Authors:Ding Lei  Qian Yuntao
Abstract:
Keywords:Text categorization Supervised learning Unsupervised learning Semi-supervised learning
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号