基于主观Bayes方法的渐进式中文文档分类 |
| |
引用本文: | 汪保友,周益群,周水庚,胡运发.基于主观Bayes方法的渐进式中文文档分类[J].模式识别与人工智能,2001,14(4). |
| |
作者姓名: | 汪保友 周益群 周水庚 胡运发 |
| |
作者单位: | 复旦大学,计算机科学系,上海,200433 |
| |
基金项目: | 国家高技术研究发展计划(863计划) |
| |
摘 要: | 本文介绍基于主观Bayes方法的渐进式中文文档分类.包括三个方面:一是应用主观Bayes方法,利用领域专家的经验,减少复杂的计算量.二是采用渐进式中文文档分类,先进行粗分类,把文档集映射到大的类别集中去,再对属于每一大类别中的文档子集进行细分类,映射到次级类别中去,直到划分到最后的基类.三是选择文档属性时,采用相邻字对提取方法,某种程度可摆脱对复杂切词处理程序和庞大词库的依赖.
|
关 键 词: | 文档分类 naive Bayes方法 |
PERSONAL BAYES METHOD FOR HIERARCHY CHINESE DOCUMENT CATEGORIZATION |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|