首页 | 本学科首页   官方微博 | 高级检索  
     

基于模糊粗糙集的肿瘤分类特征基因选取
引用本文:徐菲菲,苗夺谦,魏莱.基于模糊粗糙集的肿瘤分类特征基因选取[J].计算机科学,2009,36(3):196-200.
作者姓名:徐菲菲  苗夺谦  魏莱
作者单位:1. 同济大学计算机科学与技术系,上海,201804
2. 同济大学嵌入式系统与服务计算教育部重点实验室,上海,201804
基金项目:国家自然科学基金,国家自然科学基金重点项目,国家重点基础研究发展规划(973计划),高等学校博士学科点专项科研基金 
摘    要:依据基因表达谱有效建立肿瘤分类模型的关键在于,准确找出决定样本类剐的一组特征基因.粗糙集理论作为一种新的软计算方法能够保持在原数据集的分类能力不变的基础上,对属性极大约简,从大量基因中找到对分类有效的基因.由于基因表达谱数据集的连续性,为了避免运用粗糙集方法所必需的离散化过程带来的信息丢失,尝试将模糊粗糙集应用于特征基因的选取,提出了基于互信息的模糊粗糙集属性约简算法,运用于基因表达谱数据集的基因选取.然后分别采用KNN和C5.0分类器进行特征基因分类性能进行检验.以急性白血病亚型(leukemia Microarray)和直肠癌(colon Microarray)分类特征基因选取为例进行实验,结果表明了上述方法的可行性和有效性.

关 键 词:基因表达谱数据集  特征选取  粗糙集  模糊粗糙集  互信息
收稿时间:2008/4/17 0:00:00

Feature Selection for Cancer Classification Based on Fuzzy Rough Sets
XU Fei-fei,MIAO Duo-qian,Wei Lai.Feature Selection for Cancer Classification Based on Fuzzy Rough Sets[J].Computer Science,2009,36(3):196-200.
Authors:XU Fei-fei  MIAO Duo-qian  Wei Lai
Affiliation:Department of Computer Science and Technology;Tongji University;Shanghai 201804;China;Key Laboratory of Embedded System & Service Computing;Ministry of Education of China;China
Abstract:Feature selection is an essential step to perform cancer classification with DNA microarrays,for there are a large number of genes from which to predict classes and a relatively small number of samples.Rough set theory is a tool for reducing redundancy in information systems,thus successful application of rough set to gene selection is of great si-gnificance.Fuzzy rough set was introduced to avoid losing information caused by discretization of continuous gene expre-ssion data which is needed in rough set th...
Keywords:Gene expression data  Feature selection  Rough sets  Fuzzy rough sets  Mutual information  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号