首页 | 本学科首页   官方微博 | 高级检索  
     

一种共调控基因C均值模糊聚类算法
引用本文:张黎,逄涣利,王小虎,王佳. 一种共调控基因C均值模糊聚类算法[J]. 计算机工程与应用, 2010, 46(7): 32-33. DOI: 10.3778/j.issn.1002-8331.2010.07.010
作者姓名:张黎  逄涣利  王小虎  王佳
作者单位:1.长春工业大学 计算机科学与工程学院,长春 130021 2.大连工业大学 网络中心,辽宁 大连 116034
摘    要:聚类方法在基因表达数据分析中发挥着非常重要的作用,但基因表达数据相对其他领域的数据具有自身的特性,因此传统的数据距离定义和聚类方法已不能完全满足研究者对生物数据的分析要求。提出一种基于泊松分布的数据距离度量方式TransChisq,它以一种全新的视角定义了基因数据之间的距离,鉴于模糊聚类算法能够更加深刻地描述复杂的基因作用关系,将TransChisq距离与模糊聚类方法相结合对模糊C均值算法进行改进,并应用于真实基因表达数据分析。实验结果表明,该方法能够按照生物学的真实分类将基因表达数据聚类,并且可以发现更多的共调控基因,更加满足了基因表达数据分析的需要。

关 键 词:模糊C均值  基因表达数据  距离  
收稿时间:2008-10-15
修稿时间:2009-2-3 

Fuzzy C means cluster algorithm for co-regulation genes
ZHANG Li,PANG Huan-li,WANG Xiao-hu,WANG Jia. Fuzzy C means cluster algorithm for co-regulation genes[J]. Computer Engineering and Applications, 2010, 46(7): 32-33. DOI: 10.3778/j.issn.1002-8331.2010.07.010
Authors:ZHANG Li  PANG Huan-li  WANG Xiao-hu  WANG Jia
Affiliation:1.School of Computer Science and Engineering,Changchun University of Technology,Changchun 130021,China 2.Web Center,Dalian Polytechnic University,Dalian,Liaoning 116034,China
Abstract:Cluster methods plays an important role in the gene expression data analysis,but the gene expression data has its own feature compared with the data in others fields,so the traditional distance measurement and cluster methods can not completely meet the target of researchers.The TransChisq distance based on Poisson distribution provides a new perspective to define the relationship between genes according to biological meaning,while fuzzy cluster algorithm can depict the complex interactions among genes thor...
Keywords:fuzzy C-means cluster  gene expression date  distance
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号