首页 | 本学科首页   官方微博 | 高级检索  
     

基于马氏距离和H-K聚类的空值估计研究
引用本文:陈睿进,张聪,毛宇光.基于马氏距离和H-K聚类的空值估计研究[J].计算机光盘软件与应用,2014(20).
作者姓名:陈睿进  张聪  毛宇光
作者单位:1. 南京航空航天大学 计算机科学与技术学院,南京,211106
2. 南京航空航天大学 计算机科学与技术学院,南京 211106; 计算机软件新技术国家重点实验室 南京大学,南京 210093
摘    要:传统的基于欧氏距离和K-means聚类算法的空值估计算法容易因为欧氏距离对量纲的敏感性和初始聚类中心对K-means聚类效果的影响产生估值误差。将层次聚类算法和K-means聚类算法有机结合起来的H-K聚类算法克服了K-means算法对初始聚类中心的敏感性,从而改善了聚类效果。与欧氏距离不同,马氏距离可以避免量纲的影响。为此提出一种改进的空值估计算法,将H-K聚类应用到空值估计算法中进行聚类,在聚类时采用马氏距离代替欧氏距离,在聚类后使用多元线性回归法计算样本中的空值。实验结果表明改进后的空值估计算法使得估计值的绝对误差率(MAER)得到降低。

关 键 词:K-means算法  层次聚类  H-K聚类算法  马氏距离  空值估计
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号