K-means型多视图聚类中的初始化问题研究 |
| |
引用本文: | 洪敏,贾彩燕,王晓阳. K-means型多视图聚类中的初始化问题研究[J]. 计算机科学与探索, 2019, 13(4): 574-585 |
| |
作者姓名: | 洪敏 贾彩燕 王晓阳 |
| |
作者单位: | 北京交通大学 计算机与信息技术学院,北京 100044;交通数据分析与挖掘北京市重点实验室,北京 100044;北京交通大学 计算机与信息技术学院,北京 100044;交通数据分析与挖掘北京市重点实验室,北京 100044;北京交通大学 计算机与信息技术学院,北京 100044;交通数据分析与挖掘北京市重点实验室,北京 100044 |
| |
基金项目: | The General Program of the National Natural Science Foundation of China under Grant Nos. 61473030, 61632004;the Fundamental Research Funds for the Central Universities of China under Grant |
| |
摘 要: | 在K-means型多视图聚类算法中,最终的聚类结果会受到初始类中心的影响。因此研究了不同的初始中心选择方法对K-means型多视图聚类算法的影响,并提出一种基于采样的主动式初始中心选择方法(sampledclustering by fast search and find of density peaks,SDPC)。该方法通过对数据集进行均匀采样,利用密度峰值快速搜索聚类算法(clustering by fast search and find of density peaks,DPC),以及K-means再迭代策略,进一步改善多视图聚类中的初始中心选择效率和类个数问题。实验验证了不同初始化方法对K-means型多视图聚类算法的影响。多视图基准数据集上的实验结果表明:全局(核)K-means初始化方法存在时间复杂度过高的问题,AFKMC~2(assumption-free K-Markov chain Monte Carlo)初始化适用于大规模数据,DPC可以主动选择类个数和初始类中心,SDPC较DPC而言,不仅能主动式获得类个数,还在聚类精度和效率上取得了较好的折衷。
|
关 键 词: | 多视图 类初始化 聚类 |
Research on Initialization of K-means Type Multi-View Clustering |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|