首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 437 毫秒
1.
基因数据双聚类是基因表达数据矩阵中具有相近的表达水平的子矩阵,其中的行和列分别代表基因子集和条件子集。双聚类算法则是在基因数据矩阵的行和列2个方向上同时聚类以找出这样的子矩阵。本文提出基于模拟退火与粒子群优化的混合优化算法,避免单纯模拟退火法中的概率突跳性缺点。我们算法采用自底向上的搜索策略,首先生成双聚类种子,然后采用混合优化算法添加种子的行和列,找出最优聚类结果。在酵母细胞基因数据集的实验中,我们双聚类的各项指标能够达到高质量结构,验证了本文方法的有效性。  相似文献   

2.
双聚类算法是为了发现基因表达数据矩阵中局部相似性而提出的新聚类方法。本文根据Cheng和Church的打分理论采用自底向上的策略,首先用粗糙k均值算法生成初始的基因数据块,再对这些数据块添加行和列,生成初始的双聚类。然后,删除初始的双聚类中一致性波动不好的行和列,从而得到最终的双聚类。实验表明,该算法能够高效地生成具有共表达水平的双聚类,更能找到一致波动水平很高的双聚类。  相似文献   

3.
基因表达数据是由DNA微阵列实验产生的大规模数据矩阵,双聚类算法是挖掘数据矩阵中具有较高相关性的子矩阵,能有效地提取生物学信息。针对当前多目标双聚类优化算法易于陷入早熟和局部最优解等问题,论文提出了基于逻辑运算的离散人工蜂群优化双聚类算法(LOABCB算法),一方面引入人工蜂群算法增强双聚类的全局寻优能力,另一方面通过逻辑运算邻域搜索策略寻找最优双聚类,提高搜索效率。采用基因表达数据的酵母细胞数据集进行实验,结果表明论文算法能够获得实验效果优的具有生物意义的双聚类。  相似文献   

4.
生物基因表达数据的双向聚类已成为近年来生物信息学的研究热点.生物基因表达数据双聚类问题通常需要同时最优化双聚类中基因表达行为的波动一致性以及双聚类的容量.基于单目标优化的双聚类算法难以很好地同时优化这两个目标.针对这个问题,本文采用了多目标微分进化算法来求解基因表达数据的双向聚类问题.算法在真实的基因表达数据集上测试,实验结果表明,本文所提算法具有更优的聚类效果.  相似文献   

5.
双聚类是用基因表达数据矩阵中部分行与列的相互表达水平,即矩阵中的子矩阵。文章提出一种基于模拟退火的文化混合优化算法,以文化算法为整体框架嵌入模拟退火法,作为种群空间的一个演化过程,避免模拟退火的概率突跳性缺点。在酵母细胞数据集实验中,文中的算法在时间消耗增加不多的情况下,搜索出的双聚类质量高,实验效果良好。  相似文献   

6.
现有的双聚类算法缺乏发现具有重叠结构双聚类的能力,无法有效发现基因表达数据中隐藏的相应双聚类结构,并且在增删条件过程中均未考虑条件重要性对双聚类结果的影响.针对上述问题,文中提出基于加权均方残差的改进双聚类算法.首先利用重叠率和隶属度控制的模糊划分将基因集划分为初始双聚类,然后在最小化目标函数过程中迭代修改各双簇中条件的权重,最后利用加权的均方残差添加符合条件的基因,删除优化的双聚类中一致波动性不好的基因,得到最终的双聚类集.实验表明,文中算法不仅能生成具有共表达水平大小不同的双簇,并且能将重叠率控制在合理范围内.  相似文献   

7.
双聚类是一种可以同时在基因和条件两个维度上分析基因表达数据的方法,它可以找出在部分条件下具有相似表达趋势的基因。已有的方法都是从一个数据集中挖掘双聚类。从生物意义上分析,从不同基因表达数据集中挖掘差异表达双聚类可以发现具有生物意义的转录因子等信息。因此,提出一种挖掘不同数据集上差异共表达双聚类的算法——DiCluster。该算法采用深度优先基因扩展方法,并引入了剪枝策略,有效挖掘最大差异表达双聚类。实验结果表明,DiCluster不仅比已有算法具有更高的效率,而且挖掘出的结果具有更好的统计学和生物学意义。  相似文献   

8.
癌症基因表达数据的聚类分析可以为癌症的早期诊断和精确的癌症亚型分型提供依据。针对癌症基因表达数据的特点,提出一种称为OMB(Override Matrix Bicluster)的双向聚类算法。OMB算法分别在基因表达数据矩阵的行和列上搜索低于阈值的行和列,用删除添加算法产生一个子矩阵;构建与基因表达矩阵大小相同的覆盖矩阵,标识矩阵中上一次迭代产生的子矩阵的位置;在标识出来的矩阵中,重复贪婪迭代搜索找到K个聚类结果。Matlab实验结果表明OMB算法对具有重叠结构的癌症基因表达数据具有更好的聚类效果。  相似文献   

9.
针对现有双聚类算法在运行过程中会改变原矩阵模式缺陷,为在寻找较大双聚类的基础之上寻找具有重叠的双聚类结果,提出一种基于概率计算的重叠双聚类算法即OBP算法.算法采用对矩阵行列赋予不同删除概率的方式进行迭代搜索,在前面聚类结果中出现次数较多的矩阵行列赋予较大的删除概率,反之赋予较小的删除概率.实验结果表明,该算法不仅能发现较大的双聚类结果,而且可以通过设置重叠控制系数μ来有效地控制双聚类结果的重叠程度.  相似文献   

10.
双聚类方法是当前分析基因表达数据的一个重要研究方向,其挖掘目标是发现哪些基因在哪些实验条件下具有相似的表达水平或者关系密切.目前已提出了许多双聚类算法来挖掘不同类型的双聚类,然而其大部分挖掘效率不高.鉴于此,提出了一个新颖的挖掘算法——MRCluster,其主要是用来从原始的基因表达数据中挖掘最大的行常量双聚类模式.就其挖掘效率来说,它采用的是基于Apriori原则的基因扩展深度优先的挖掘策略,并且在挖掘过程中引入了一些新颖的剪枝技术来提高效率.将MRCluster和一个行常量双聚类模式挖掘方法RAP(range support pattern)算法进行比较,从实验结果上可以看出,相比RAP算法,MRCluster算法对在原始的基因表达数据中挖掘最大的行常量双聚类模式具有更好的效率.因此,MRCluster算法能够有效地从原始的基因表达数据中挖掘最大的行常量双聚类.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号