首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于双聚类的缺失数据填补方法
引用本文:郝胜轩,宋宏,周晓锋. 一种基于双聚类的缺失数据填补方法[J]. 计算机应用研究, 2015, 32(3)
作者姓名:郝胜轩  宋宏  周晓锋
作者单位:1. 中国科学院沈阳自动化研究所,沈阳110016;中国科学院大学,北京100049
2. 中国科学院沈阳自动化研究所,沈阳,110016
基金项目:国家重大科技专项基金资助项目
摘    要:针对现实数据集的数据缺失问题,提出了一种基于双聚类的缺失数据填补新方法.该算法利用双聚类簇内平均平方残值越小簇内数据相似性越高的这一特性,将缺失数据的填补问题转换为求解特定双聚类簇最小平均平方残值的问题,进而实现了数据集中缺失元素的预测;再利用二次函数求解极小值的思想对包含有缺失数据的特定双聚类簇最小平均平方残值的问题进行求解,并进行了数学上的分析证明.最后进行仿真验证,通过观察UCI数据集的实验结果可知,提出的算法具有较高的填补准确性.

关 键 词:缺失数据填补  双聚类  双聚类数据填补  数据清洗

Novel approach for missing data imitation based on biclustering
HAO Sheng-xuan,SONG Hong,ZHOU Xiao-feng. Novel approach for missing data imitation based on biclustering[J]. Application Research of Computers, 2015, 32(3)
Authors:HAO Sheng-xuan  SONG Hong  ZHOU Xiao-feng
Abstract:
Keywords:missing data imputation  biclustering  biclustering-based data imputation  data cleaning
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号