半监督的文本分类——两阶段协同学习 |
| |
引用本文: | 郝秀兰,胡运发. 半监督的文本分类——两阶段协同学习[J]. 小型微型计算机系统, 2009, 30(10) |
| |
作者姓名: | 郝秀兰 胡运发 |
| |
作者单位: | 复旦大学计算机科学技术学院,上海,200433 |
| |
基金项目: | 国家自然科学基金重大项目 |
| |
摘 要: | 传统的分类器仅使用有标签的数据进行训练,然而,有标签的实例通常因昂贵、耗时而难以获得,从而造成标注瓶颈问题.半监督学习通过大量的无标签数据与有标签数据相结合来创建性能良好的分类器,从而解决标注瓶颈问题.由于半监督的学习需要较少的人工介入,而精确率又较高,因此无论在理论上还是实践上都具有意义.本文在对已有的半监督学习算法进行研究的基础上,针对有标签数据相当少时,无法使用统计方法进行标注置信度评价的情况,提出了基于kNN和SVM的二阶段协同学习,实验证实该方法是有效的.
|
关 键 词: | 半监督学习 文本分类 协同学习 |
Semi-supervised Text Categorization with Two Phases Co-training |
| |
Abstract: | |
| |
Keywords: | kNN SVM |
本文献已被 万方数据 等数据库收录! |
|