首页 | 官方网站   微博 | 高级检索  
     

利用连通分支对基因表示数据的聚类算法
引用本文:周海岩,严云洋.利用连通分支对基因表示数据的聚类算法[J].计算机工程与应用,2008,44(9):152-155.
作者姓名:周海岩  严云洋
作者单位:淮阴工学院 计算机工程系,江苏 淮安 223001
基金项目:江苏省科技公关计划 , 淮安市科技发展项目
摘    要:在生命科学中,需要对物种及基因进行分类,以获得对种群固有结构的认识。利用数据聚类方法,有效地辨别/识别基因表示数据的模式,对它们进行分类。将特征相似性大的归为一类,特征相异性大的归为不同类。这对于研究基因的结构、功能、以及不同种类基因之间的关系都具有重要意义。利用图论的方法对分子生物学中基因表示数据进行初始聚类,然后再结合别的算法,如K-近邻自学习聚类算法或基于中心点的自学习聚类算法,对其进一步求精。对于某种聚类判别准则,能够产生全局最优簇。最后对算法进行了分析和讨论,并用模拟数据进行了实验验证。

关 键 词:基因表示数据  数据聚类  簇类  无向图  连通分支  
文章编号:1002-8331(2008)09-0152-04
收稿时间:2007-3-9
修稿时间:2007-9-13  

Algorithm for clustering gene expression data using connected components
ZHOU Hai-yan,YAN Yun-yang.Algorithm for clustering gene expression data using connected components[J].Computer Engineering and Applications,2008,44(9):152-155.
Authors:ZHOU Hai-yan  YAN Yun-yang
Affiliation:Department of Computer Engineering,Huaiyin Institute of Technology,Huaian,Jiangsu 223001,China
Abstract:In life sciences,it is necessary to classify the species and genes in order to obtain the knowledge of these species.Using data clustering algorithm can effectively distinguish/identify the mode of gene expression data and categorize them.Those with most similarity are grouped into one category and those with most difference into another category,which is very important to study the structure,function and relations between different genes.Gene expression data in biology science are initially clustered by adopting the method of graph theory and then refined by combining with other method,i.e. k-near neighbor self-learning clustering algorithm or medoid-based self-learning clustering algorithm.Global optimal clusters can be generated for a specific clustering judgment rule.At last analyses and discusses the algorithm,which are tested with simulation data.
Keywords:gene expression data  data clustering  cluster  undirected graph  connected components
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号