首页 | 本学科首页   官方微博 | 高级检索  
     

基于主观Bayes方法的渐进式中文文档分类
引用本文:汪保友,周益群,周水庚,胡运发.基于主观Bayes方法的渐进式中文文档分类[J].模式识别与人工智能,2001,14(4).
作者姓名:汪保友  周益群  周水庚  胡运发
作者单位:复旦大学,计算机科学系,上海,200433
基金项目:国家高技术研究发展计划(863计划)
摘    要:本文介绍基于主观Bayes方法的渐进式中文文档分类.包括三个方面:一是应用主观Bayes方法,利用领域专家的经验,减少复杂的计算量.二是采用渐进式中文文档分类,先进行粗分类,把文档集映射到大的类别集中去,再对属于每一大类别中的文档子集进行细分类,映射到次级类别中去,直到划分到最后的基类.三是选择文档属性时,采用相邻字对提取方法,某种程度可摆脱对复杂切词处理程序和庞大词库的依赖.

关 键 词:文档分类  naive  Bayes方法

PERSONAL BAYES METHOD FOR HIERARCHY CHINESE DOCUMENT CATEGORIZATION
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号