一种改进的增量式贝叶斯文本分类算法 |
| |
作者单位: | ;1.东华大学计算机科学与技术学院 |
| |
摘 要: | 针对难以获得大量有标签的训练集问题,将增量式贝叶斯学习用于小规模训练集上,并提出了一种新的序列学习算法以弥补其学习序列中存在的不足:无法充分利用先验知识导致噪声数据不断传播。在增量学习的样本选择上,算法引入了配对样本检验和类支持度的知识,分别从横向和纵向角度充分利用先验知识来选取最优增量子集优化分类器,使分类器参数在动态学习过程中得以强化。实验结果表明,该算法能有效弱化噪声数据的消极影响,提高分类精度,同时能大幅度减少增量学习时间。
|
关 键 词: | 增量学习 贝叶斯分类 配对样本检验 类支持度 |
AN IMPROVED INCREMENTAL BAYESIAN TEXT CLASSIFICATION ALGORITHM |
| |
Abstract: | |
| |
Keywords: | |
|
|