基于特征变换的Tri-Training算法 |
| |
引用本文: | 赵文亮,郭华平,范 明.基于特征变换的Tri-Training算法[J].计算机工程,2014(5):183-187,191. |
| |
作者姓名: | 赵文亮 郭华平 范 明 |
| |
摘 要: | 提出一种基于特征变换的Tri Training算法。通过特征变换将已标记实例集映射到新空间,得到有差异的训练集,从而构建准确又存在差异的基分类器,避免自助采样不能充分利用全部已标记实例集的问题。为充分利用数据类分布信息,设计基于Must link和Cannot link约束集合的特征变换方法(TMC),并将其用于基于特征变换的Tri Training算法中。在UCI数据集上的实验结果表明,在不同未标记率下,与经典的Co Training、Tri Trainng算法相比,基于特征变换的Tri Training算法可在多数数据集上得到更高的准确率。此外,与Tri LDA和Tri CP算法相比,基于TMC的Tri Training算法具有更好的泛化性能。
|
关 键 词: | 特征变换 已标记实例集 差异 自助抽样 泛化能力 |
本文献已被 CNKI 等数据库收录! |
|