首页 | 本学科首页   官方微博 | 高级检索  
     

基于Relief和SVM-RFE的组合式SNP特征选择
引用本文:吴红霞,吴 悦,刘宗田,雷 州. 基于Relief和SVM-RFE的组合式SNP特征选择[J]. 计算机应用研究, 2012, 29(6): 2074-2077
作者姓名:吴红霞  吴 悦  刘宗田  雷 州
作者单位:上海大学 计算机工程与科学学院,上海,200072
基金项目:上海市科委重点基础项目(09JC1411302);上海市重点学科建设项目(J50103)
摘    要:针对SNP的全基因组关联分析面临SNP数据的高维小样本特性和遗传疾病病理的复杂性两大难点,将特征选择引入SNP全基因组关联分析中,提出基于Relief和SVM-RFE的组合式SNP特征选择方法。该方法包括两个阶段:Filter阶段,使用Relief算法剔除无关SNPs;Wrapper阶段,使用基于支持向量机的特征递归消减方法(SVM-RFE)筛选出与遗传疾病相关的关键SNPs。实验表明,该方法具有明显优于单独使用SVM-RFE算法的性能,优于单独使用Relief-SVM算法的分类准确率,为SNP全基因组关联分析提供了一种有效途径。

关 键 词:单核苷酸多态性  全基因组关联研究  特征选择  过滤式  缠绕式  组合式

Combined SNP feature selection based on relief and SVM-RFE
WU Hong-xi,WU Yue,LIU Zong-tian,LEI Zhou. Combined SNP feature selection based on relief and SVM-RFE[J]. Application Research of Computers, 2012, 29(6): 2074-2077
Authors:WU Hong-xi  WU Yue  LIU Zong-tian  LEI Zhou
Affiliation:School of Computer Engineering & Science, Shanghai University, Shanghai 200072, China
Abstract:The genome-wide association study (GWAS)on SNPs faces two big issues: high dimensional SNP data with small sample characteristics and complex mechanisms of genetic diseases. This paper proposed a combined SNP feature selection method through bring feature selection methods into GWAS. The method included two stages: filter stage, it used Relief algorithm to eliminate irrelevant SNP features, wrapper stage, it used support vector machine based recursive feature reduction (SVM-RFE) algorithm to select the key SNPs set. Experiments show that the proposed method has an obviously better performance than SVM RFE algorithm, and also gains higher classification accuracy than Relief-SVM algorithm, which provides an effective way for SNP genome-wide association analysis.
Keywords:SNP   GWAS   feature selection   filter   wrapper   combined
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号