首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 68 毫秒
1.
基因微阵列(DNA microarray)是实验分子生物学中的一个重要突破,其使得研究者可以同时监测多个基因在多个实验条件下表达水平的变化,进而为发现基因协同表达网络、研制药物、预防疾病等提供技术支持.研究者们提出了大量的聚类算法来分析基因表达数据,但是标准的聚类算法(单向聚类)只能发现少量的知识.因为基因不可能在所有实验条件下共表达,也不可能展示出相同的表达水平,但是可能参与多种遗传通路.在这种情况下,双聚类方法应运而生.这样就将基因表达数据的分析从整体模式转向局部模式,从而改变了只根据数据的全部对象或属性将数据聚类的局面.主要从局部模式的定义、局部模式类型与标准、局部模式的挖掘与查询等方面进行了梳理.介绍了基因表达数据中局部模式挖掘当前的研究现状与进展,详细总结了基于定量和定性的局部模式挖掘标准以及相关的挖掘系统,分析了存在的问题,并深入探讨了未来的研究方向.  相似文献   

2.
基于DNA微阵列基因表达数据的分类方法研究   总被引:1,自引:1,他引:0  
介绍了目前几种基于DNA微阵列基因表达数据的分类方法。分别阐述了递归分割法、构建森林法以及信息融合方法的算法思想,对每种方法进行了深入描述,并对它们进行了分析和比较。最后对基于基因表达微阵列数据的分类技术进行了展望。  相似文献   

3.
计算机方法识别转录因子结合位点(TFBS,也称“模式”)是目前生物信息学的一个很有吸引性和挑战性的课题。吉布斯采样识别模式的算法本质上是一个启发式搜索方法,容易陷入非全局最优的局部最大值。为此,提出了一种改进的吉布斯采样策略YGMS(Yeast Gibbs Motif Sampler)采识别酿酒酵母共表达基因调控区域转录因子结合位点。在酵母的共调控基因序列的数据集测试中,YGMS比其他几个基于吉布斯采样算法更有效地识别出真实模式序列,在一定程度上提高了算法的性能。  相似文献   

4.
基于微阵列表达数据,探索新的有效特征提取和分类方法。采用小波多分辩率分析方法提取基因表达的特征,利用支持向量机和BP神经网络方法进行分类。基因表达具有明显的多尺度特征,分类率最大达到98.61%,结果稳定。采用多尺度理论对基因表达数据进行分析是一种新的有效的生物信息学方法,值得进一步探索与研究。  相似文献   

5.
针对两种基于KNN图孤立点检测方法:入度统计法(ODIN)和K最邻近(K-nearest Neighbor,RSS)算法的不足,提出了一种新的改进方法:两阶段孤立点检测方法,并进行了适当扩充使之适用于数据集中孤立点数目未知情况下的孤立点检测。算法应用于“小样本,高维度”的基因微阵列数据集进行样本孤立点检测取得了很好效果,证明了此方法的有效性。  相似文献   

6.
转录调控、转录翻译和信号传导网络等生化网络分别刻画不同的生物过程,描述细胞的不同生命活动。对这些生化网络进行计算机建模与分析,不仅可以获得细胞生长各阶段更加全面的认识,同时对药物靶点的确定和代谢工程的发展也有着深远的影响。基于约束的重构和分析方法COBRA是一套完整的对生化网络进行建模和分析的框架。它已被广泛应用于全基因组规模代谢网络的研究中,同时在应用过程中也发展出了许多极具价值的分析方法。近年来,COBRA框架也被陆续应用到其它生化网络中。主要介绍COBRA框架在转录调控、转录翻译和信号传导网络中的建模和分析方面的应用,并且简要评述COBRA框架的研究现状及可能的发展方向。  相似文献   

7.
通过介绍改进的多代理系统在分析基因表达数据中的应用,揭示了运用普通分类器找出有效的分类基因,而且这些普通分类器在研究基因表达数据库时可被代理使用.这样就可得到一个具有大量基因特征的小子集,并且用它可以帮助辨认病人的临床状况和特征.实验表明代理通过改进和相互协作可改进其性能,并通过两个著名的基因表达问题来展示项目的研究成果,而且使得量度的准确性在维数增加时变得不很敏感.  相似文献   

8.
本文使用遗传算法解决多序列比对问题,并进一步研究了各种遗传算子在比对过程中所起的作用,对算法进行了改进。最后实现了一个多序列比对程序,对实验结果进行分析。  相似文献   

9.
乔昕  钱松荣 《计算机工程与应用》2004,40(25):145-148,192
该文通过对目前应用较为广泛的PGM协议和双峰组播协议进行了分析,并在此基础上对两种不同类型的可靠组播协议族在可扩展性、稳定性等方面进行了比较与分析,为今后可靠组播协议的发展提供帮助。  相似文献   

10.
转录调控网络和代谢网络分别刻画了细胞新陈代谢过程的不同阶段,两个阶段相互作用,影响细胞的生命活动.调控-代谢网络的集成建模是生物网络建模的一个重要方向,通过集成调控-代谢网络可以对整个反应体系而不是单单对代谢网络进行考察,能够获得关于代谢和细胞功能的更全面认识,不仅有助于解释生命现象,同时对于代谢工程和合理选择药物靶标也有很大的意义.随着大规模高通量实验技术的发展,基因组、生物化学和生理学等各方面的信息海量涌现,为重构基因组规模的系统生物学模型提供了可能.介绍了国内外关于转录-调控网络的集成建模和分析方法,并简要评述了目前的研究现状以及可能的发展方向.  相似文献   

11.
基于支持向量机的微阵列基因表达数据分析方法   总被引:5,自引:0,他引:5  
DNA微阵列技术,使人们可以同时观测成千上万个基因的表达水平,对其数据的分析已成为生物信息学研究的焦点.针对微阵列基因表达数据维数高、样本小、非线性的特点,设计了一种基于支持向量机的基因表达数据分类识别方法,该方法采用信噪比进行基因特征提取,运用支持向量机的不同核函数进行性能测试,针对几个典型数据集的实验表明其识别效果良好.  相似文献   

12.
13.
基因表达谱芯片数据挖掘系统*   总被引:1,自引:0,他引:1  
李荣 《计算机应用研究》2009,26(8):2938-2941
基因芯片是基因组研究的重要工具,其数据分析极大依赖于数据挖掘技术。结合数据挖掘技术和生物信息学研究,设计并实现了若干基因表达谱芯片数据挖掘分析模型及相应的数据挖掘系统,具有良好的收缩性和实体独立性,底层复杂的数据挖掘算法对用户透明。  相似文献   

14.
马煜  陈莉  方鹤鹤 《微机发展》2006,16(2):117-119
微阵列技术是后基因时代功能基因组研究的主要工具。由于采用了高效的并行杂交技术,每次实验可以得到大量丰富的数据,因此其结果分析成为一项很有挑战性而且具有重要意义的工作。聚类分析是微阵列数据分析中使用最为广泛的一类方法。微阵列实验得到的大量数据通过聚类分析,可以得到很多有用的信息,其成功应用已广泛涉及到基因功能研究和生物医学研究中的各个领域。文中介绍了基因微阵列数据的聚类分析方法及其重要应用。  相似文献   

15.
基因表达数据的聚类分析研究进展   总被引:3,自引:1,他引:3  
基因表达数据的爆炸性增长迫切需求自动、有效的数据分析工具. 目前聚类分析已成为分析基因表达数据获取生物学信息的有力工具. 为了更好地挖掘基因表达数据, 近年来提出了许多改进的传统聚类算法和新聚类算法. 本文首先简单介绍了基因表达数据的获取和表示, 之后系统地介绍了近年来应用在基因表达数据分析中的聚类算法. 根据聚类目标的不同将算法分为基于基因的聚类、基于样本的聚类和两路聚类, 并对每类算法介绍了其生物学的含义及其难点, 详细讨论了各种算法的基本原理及优缺点. 最后总结了当前的基因表达数据的聚类分析方法,并对发展趋势作了进一步的展望.  相似文献   

16.
17.
微阵列实验是一个复杂的多步骤的实验过程,不确定性存在于实验的每一个步骤中,导致最后得到的实验结果中包含了一些数据噪声。为了从这些含有噪声的数据中得到更多有意义的生物信息,很多算法相继被提出来计算基因表达值。目前流行的mmgMOS模型提高了芯片数据分析的准确性,但是该模型的主要缺点是其参数值φ在整个数据集上是唯一不变的,单一的值不能代表不同探针的真实信号。本文对mmgMOS模型中的参数值φ进行改进,从而进一步提高后续寻找差异基因的准确率。  相似文献   

18.
19.
Microarray technologies are employed to simultaneously measure expression levels of thousands of genes. Data obtained from such experiments allow inference of individual gene functions, help to identify genes from specific tissues, to analyze the behavior of gene expression levels under various environmental conditions and under different cell cycle stages, and to identify inappropriately transcribed genes and several genetic diseases, among many other applications. As thousands of genes may be involved in a microarray experiment, computational tools for organizing and providing possible visualizations of the genes and their relationships are crucial to the understanding and analysis of the data. This work proposes an algorithm based on artificial immune systems for organizing gene expression data in order to simultaneously reveal multiple features in large amounts of data. A distinctive property of the proposed algorithm is the ability to provide a diversified set of high-quality rearrangements of the genes, opening up the possibility of identifying various co-regulated genes from representative graphical configurations of the expression levels. This is a very useful approach for biologists, because several co-regulated genes may exist under different conditions.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号