一种用于处理高维稀疏数据的半监督聚类算法 |
| |
作者姓名: | 崔鹏 张汝波 |
| |
作者单位: | 1. 哈尔滨工程大学计算机与技术学院,哈尔滨,150001;哈尔滨理工大学计算机与技术学院,哈尔滨,150080 2. 哈尔滨工程大学计算机与技术学院,哈尔滨,150001 |
| |
基金项目: | 863国家重点基金项目 |
| |
摘 要: | 半监督聚类是近年来研究的热点,传统的方法是在无监督算法的基础上加入有限的背景知识来提高聚类性能.然而大多数半监督聚类技术都基于邻近或密度,难以处理高维数据,因此必须将约减的特征加入到半监督聚类过程中.为解决此问题,提出了一种新的半监督聚类算法框架.该算法利用样本约束传递性进行预处理,然后将特征投影到低维空间实现降维,最终用半监督算法对约减后的样本进行聚类.通过实验同现行主要降维方法进行了比较,说明此方法能有效地处理高维数据,聚类效果良好.
|
关 键 词: | 降维 半监督聚类 特征选择 约束 |
收稿时间: | 2009-08-28 |
修稿时间: | 2009-10-18 |
本文献已被 万方数据 等数据库收录! |
|