首页 | 本学科首页   官方微博 | 高级检索  
     

从基因表达数据中挖掘最大的行常量双聚类*
引用本文:缪苗,尚学群,刘加财,王淼. 从基因表达数据中挖掘最大的行常量双聚类*[J]. 计算机应用研究, 2011, 28(12): 4447-4450
作者姓名:缪苗  尚学群  刘加财  王淼
作者单位:西北工业大学计算机学院计算机软件与理论系,西安,710129
基金项目:国家自然科学基金资助项目(60703105);西北工业大学基础研究基金资助项目(JC201042)
摘    要:双聚类方法是当前分析基因表达数据的一个重要研究方向,其挖掘目标是发现哪些基因在哪些实验条件下具有相似的表达水平或者关系密切.目前已提出了许多双聚类算法来挖掘不同类型的双聚类,然而其大部分挖掘效率不高.鉴于此,提出了一个新颖的挖掘算法——MRCluster,其主要是用来从原始的基因表达数据中挖掘最大的行常量双聚类模式.就其挖掘效率来说,它采用的是基于Apriori原则的基因扩展深度优先的挖掘策略,并且在挖掘过程中引入了一些新颖的剪枝技术来提高效率.将MRCluster和一个行常量双聚类模式挖掘方法RAP(range support pattern)算法进行比较,从实验结果上可以看出,相比RAP算法,MRCluster算法对在原始的基因表达数据中挖掘最大的行常量双聚类模式具有更好的效率.因此,MRCluster算法能够有效地从原始的基因表达数据中挖掘最大的行常量双聚类.

关 键 词:双聚类  原始数据  行常量双聚类  范围支持度  基因芯片

Mining constant row bicluster in gene expression data
MIAO Miao,SHANG Xue-qun,LIU Jia-cai,WANG Miao. Mining constant row bicluster in gene expression data[J]. Application Research of Computers, 2011, 28(12): 4447-4450
Authors:MIAO Miao  SHANG Xue-qun  LIU Jia-cai  WANG Miao
Affiliation:MIAO Miao,SHANG Xue-qun,LIU Jia-cai,WANG Miao(School of Computer Science & Engineering,Northwestern Polytechnical University,Xi'an 710129,China)
Abstract:Biclustering is one of important techniques for gene expression data analysis.A bicluster is a set of genes cohe-rently expressed for a set of biological conditions.Various biclustering algorithms have been proposed to find biclusters of different types.However,most of them are not efficient.This paper proposed a novel algorithm MRCluster to mine constant row biclusters from real-valued dataset.MRCluster used Apriori property and several novel pruning techniques to mine biclusters efficiently.This paper com...
Keywords:biclustering  real-valued data  constant row bicluster  range support  DNA microarray  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号