首页 | 本学科首页   官方微博 | 高级检索  
     

基于潜在因子模型在子空间上的缺失值注意力聚类算法
引用本文:王啸飞,鲍胜利,陈炯环.基于潜在因子模型在子空间上的缺失值注意力聚类算法[J].计算机应用,2023(12):3772-3778.
作者姓名:王啸飞  鲍胜利  陈炯环
作者单位:1. 中国科学院成都计算机应用研究所;2. 中国科学院大学
基金项目:中国科学院西部青年学者项目(RRJZ2021003)~~;
摘    要:针对传统聚类算法在对缺失样本进行数据填充过程中存在样本相似度难度量且填充数据质量差的问题,提出一种基于潜在因子模型(LFM)在子空间上的缺失值注意力聚类算法。首先,通过LFM将原始数据空间映射到低维子空间,降低样本的稀疏程度;其次,通过分解原空间得到的特征矩阵构建不同特征间的注意力权重图,优化子空间样本间的相似度计算方式,使样本相似度的计算更准确、泛化性更好;最后,为了降低样本相似度计算过程中过高的时间复杂度,设计一种多指针的注意力权重图进行优化。在4个按比例随机缺失的数据集上进行实验。在Hand-digits数据集上,相较于面向高维特征缺失数据的K近邻插补子空间聚类(KISC)算法,在数据缺失比例为10%的情况下,所提算法的聚类准确度(ACC)提高了2.33个百分点,归一化互信息(NMI)提高了2.77个百分点,在数据缺失比例为20%的情况下,所提算法的ACC提高了0.39个百分点,NMI提高了1.33个百分点,验证了所提算法的有效性。

关 键 词:潜在因子模型  缺失值  注意力机制  聚类算法  子空间
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号