一种基于Laplacian的半监督特征选择模型 |
| |
作者姓名: | 吴锦华 万家山 伍祥 霍清华 |
| |
作者单位: | 安徽信息工程学院计算机与软件工程学院,安徽 芜湖,241000;安徽信息工程学院计算机与软件工程学院,安徽 芜湖,241000;安徽信息工程学院计算机与软件工程学院,安徽 芜湖,241000;安徽信息工程学院计算机与软件工程学院,安徽 芜湖,241000 |
| |
基金项目: | 安徽省高校自然科学重点研究项目"基于稀疏理论和正则化项的特征选择方法研究";安徽省高校自然科学重大研究项目"基于互动关系与深度学习的Web知识推送技术研究;实现";安徽省高校自然科学重点研究项目"基于CamShift方法多场景下的运动目标检测和跟踪技术的分析与研究" |
| |
摘 要: | 针对LASSO算法及有关扩展模型忽略样本数据间关联信息的问题,以及有标签样本难以获取的实际情况,提出了一种半监督学习的特征选择模型。引入LASSO稀疏项,去除冗余特征,选择有效特征;引入Laplacian正则项,用于保留同类有标签和无标签样本内在的几何分布信息,帮助模型选出更具有判别能力的特征集;通过相似矩阵来重构半监督特征选择模型。在UCI数据集上的分类试验结果表明,这种方法能有效提高分类性能,同时也说明样本的几何分布信息是不应被忽略的。
|
关 键 词: | 学习算法 特征选择 无标签样本 LASSO算法 正则化项 半监督 |
本文献已被 CNKI 万方数据 等数据库收录! |
|