首页 | 本学科首页   官方微博 | 高级检索  
     

数据挖掘中基于ICA的缺失数据值的估计
引用本文:彭红毅 朱思铭 蒋春福. 数据挖掘中基于ICA的缺失数据值的估计[J]. 计算机科学, 2005, 32(12): 203-205
作者姓名:彭红毅 朱思铭 蒋春福
作者单位:中山大学数学与计算科学学院,广州,510275;中山大学数学与计算科学学院,广州,510275;中山大学数学与计算科学学院,广州,510275
基金项目:本文得到圈家自然科学基金资助(10371135).
摘    要:本文简单介绍了数据挖掘中缺失数据的研究现状及ICA的特点与发展前景,提出了基于ICA的缺失数据估计模型——ICA-MDH模型。该模型研究了数据之间存在相关关系且为非高斯分布时缺失数据的处理方法,该方法能充分利用已知数据记录中的已知信息,且具有较好的通用性。实验通过对一些不完整经济数据进行了处理。结果表明,本文提出的缺失数据估计方法的精度明显优于平均值法和PCAs法,从而验证了本文所提模型的正确性与合理性。

关 键 词:缺失数据  ICA  相关关系  高斯分布

Missing Value Estimation Based on ICA in Data Mining
PENG Hong-Yi,ZHU Si-Ming,JIANG Chun-Fu. Missing Value Estimation Based on ICA in Data Mining[J]. Computer Science, 2005, 32(12): 203-205
Authors:PENG Hong-Yi  ZHU Si-Ming  JIANG Chun-Fu
Affiliation:Department of Mathematics, Sun Yat-sen University, Guangahou 510275
Abstract:This paper introduces the study state of missing data as well as ICA's characteristics and foreground in brief,proposes a model,which is named as ICA-MDH model in this paper,based on ICA which is used abroad to dis- pose missing data under the circumstances of that data remain correlative and non-Gaussian distribution.This model takes full use of the known information of the given data to estimate missing data.By dealing with some economic data, the experiment verifies the results that ICA method is much better than PCAs and mean method,validating the correct- ness and reasonableness for the proposed model in this paper.
Keywords:Missing data  ICA(independent component analysis)  Correlation  Gaussian distribution  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号