首页 | 本学科首页   官方微博 | 高级检索  
     

基于马氏距离的缺失值填充算法
引用本文:杨涛,骆嘉伟,王艳,吴君浩. 基于马氏距离的缺失值填充算法[J]. 计算机应用, 2005, 25(12): 2868-2871
作者姓名:杨涛  骆嘉伟  王艳  吴君浩
作者单位:湖南大学,计算机与通信学院,湖南,长沙,410082;湖南大学,计算机与通信学院,湖南,长沙,410082;湖南大学,计算机与通信学院,湖南,长沙,410082;湖南大学,计算机与通信学院,湖南,长沙,410082
基金项目:湖南省自然科学基金(03JJY3095)
摘    要:提出了一种基于马氏距离的填充算法来估计基因表达数据集中的缺失数据。该算法通过基因之间的马氏距离来选择最近邻居基因,并将已得到的估计值应用到后续的估计过程中,然后采用信息论中熵值的概念计算最近邻居的加权系数,得到缺失数据的填充值。实验结果证明了该算法具有有效性,其性能优于其他基于最近邻居法的缺失值处理算法。

关 键 词:微阵列  缺失值估计  马氏距离  信息熵
文章编号:1001-9081(2005)12-2868-04
收稿时间:2005-06-03
修稿时间:2005-06-032005-08-22

Missing value estimation for gene expression data based on Mahalanobis distance
YANG Tao,LUO Jia-wei,WANG Yan,WU Jun-hao. Missing value estimation for gene expression data based on Mahalanobis distance[J]. Journal of Computer Applications, 2005, 25(12): 2868-2871
Authors:YANG Tao  LUO Jia-wei  WANG Yan  WU Jun-hao
Affiliation:College of Computer and Communications, Hunan University, Changsha Hunan 410082, China
Abstract:A imputation method based on Mahalanobis distance was proposed to estimate missing values in the gene expression data. The nearest neighbors were chosen by the Mahalanobis distance between genes, and then the concept of entropy was utilized to obtain estimations of missing values. The imputed values were used for the later imputation. Experiments prove that the method is valid and its performance is higher than the other imputation methods based on k-nearest neighbors for gene expression data.
Keywords:microarray   missing value estimation   Mahalanobis distance   entropy
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号