首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
生物基因表达数据的双向聚类已成为近年来生物信息学的研究热点.生物基因表达数据双聚类问题通常需要同时最优化双聚类中基因表达行为的波动一致性以及双聚类的容量.基于单目标优化的双聚类算法难以很好地同时优化这两个目标.针对这个问题,本文采用了多目标微分进化算法来求解基因表达数据的双向聚类问题.算法在真实的基因表达数据集上测试,实验结果表明,本文所提算法具有更优的聚类效果.  相似文献   

2.
基于代表熵的基因表达数据聚类分析方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对基因表达数据样本少,维数高的特点,尤其是在样本分型缺乏先验知识的情况下,结合自组织特征映射的优点提出了基于代表熵的双向聚类算法。该算法首先通过自组织特征映射网络(SOM)对基因聚类,根据波动系数挑选特征基因。然后根据代表熵的大小判断基因聚类的好坏,并确定网络的神经元个数。最后采用FCM(Fuzzy C Means)聚类算法对挑选出的特征基因集进行样本分型。将该算法用于两组公开的基因表达数据集,实验结果表明该算法在降低特征维数的同时,得出了较高的聚类准确率。  相似文献   

3.
双向聚类已成为分析基因表达数据的一种重要工具,可以同时从基因和条件两个方向寻找具有相同表达波动的簇。但双向聚类是一种多目标优化的局部搜索算法,处理繁杂的基因数据时容易陷入局部最优。为提高算法的全局搜索能力,提出了一种多样性选择的量子粒子群双向聚类算法(Diversify-Optional QPSO,DOQPSO)。算法首先采用DOQPSO处理基因数据,然后用改进的FLOC算法进行贪心迭代寻找双向聚类,以求得更为理想的结果。算法通过实验仿真,并与FLOC算法和QPSO算法进行比较,结果证明DOQPSO双向聚类算法具有更好的全局寻优能力,且聚类效果更佳。  相似文献   

4.
本文提出了一种双层结构的基因表达数据聚类算法,该算法针对基因表达数据量庞大且已知功能的基因较少的特点,将聚类过程分为两个层次,快速分析层和精确聚类层。聚类结果采用信息熵方法进行评价。实验结果表明该聚类方法对于聚类基因表达数据非常有效。  相似文献   

5.
聚类方法在基因表达数据分析中发挥着非常重要的作用,但基因表达数据相对其他领域的数据具有自身的特性,因此传统的数据距离定义和聚类方法已不能完全满足研究者对生物数据的分析要求。提出一种基于泊松分布的数据距离度量方式TransChisq,它以一种全新的视角定义了基因数据之间的距离,鉴于模糊聚类算法能够更加深刻地描述复杂的基因作用关系,将TransChisq距离与模糊聚类方法相结合对模糊C均值算法进行改进,并应用于真实基因表达数据分析。实验结果表明,该方法能够按照生物学的真实分类将基因表达数据聚类,并且可以发现更多的共调控基因,更加满足了基因表达数据分析的需要。  相似文献   

6.
为改善传统的基因表达数据聚类方法正确率偏低的问题,研究了支持向量数据描述(SVDD)算法在基因表达数据聚类中的应用,该方法通过寻找最优分类超球实现对数据集的有效聚类.将类间信息融入聚类有效性评估准则中,通过模拟退火优化算法寻找SVDD算法中的最优核函数参数和惩罚因子,在训练时引入非样本数据提高运算效率.对酵母细胞生长周期的基因表达数据集的仿真实验结果表明,在新的聚类有效性评估准则下进行参数寻优,能够更快更好地得到最佳参数,同时,算法具有聚类精度高和运算速度快的优点.  相似文献   

7.
针对SOM算法中欧氏距离无法根据特征的重要性来衡量相似度、易引入无关特征干扰的缺点,提出了一种基于基因表达谱特征分布的SOM聚类算法。算法通过衡量特征对同类基因的凝聚能力和对异类基因的区分能力,对不同的特征赋予不同的权值,将此权值引入到基因数据与神经元的相似度计算中,并利用改进的粒子群优化算法调整获胜神经元及邻接神经元的权值。实验结果表明,该算法有效增强了聚类结果的类内凝聚度和类间区分度,提高了聚类准确率。  相似文献   

8.
对k-means初始聚类中心的优化   总被引:1,自引:0,他引:1  
针对传统k-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布选取初始聚类中心的改进k-means算法。该算法利用贪心思想构建K个数据集合,集合的大小与数据的实际分布密切相关,集合中的数据彼此间相互靠近。取集合中数据的平均值作为初始聚类中心,由此得到的初始聚类中心非常接近迭代聚类算法期待的聚类中心。理论分析和实验结果表明,改进算法能改善其聚类性能,并能得到稳定的聚类结果,取得较高的分类准确率。  相似文献   

9.
一种新聚类算法在基因表达数据分析中的应用   总被引:2,自引:1,他引:1       下载免费PDF全文
自组织特征映射神经网络与层次聚类算法是两种较经典的分析基因表达数据的聚类算法,但由于基因表达数据的复杂性与不稳定性,这两种算法都存在着自身的优劣。因此,在比较两种算法差异性的基础上,创造性地提出了一种新算法,即通过SOM算法对基因表达数据进行聚类,再用层次聚类将每个类对应的神经元权值二次聚类,并将此算法应用在酵母菌基因表达数据中,用实验证明改进算法克服了自组织算法的一些缺陷,提高了基因聚类的效能。  相似文献   

10.
对于时间序列的基因表达数据,传统的聚类算法都是以距离为相似性度量标准,没有考虑基因随时间变化的相似趋势。从基因变化的趋势出发,构造了一种新的模糊相似关系矩阵,提出了改进的基于模糊相似关系的聚类算法,并以该算法计算FCM的初始聚类中心。将该方法应用在酵母菌基因表达数据中,实验结果表明该算法不仅克服了FCM算法易陷入局部极小值、对初值敏感的缺点,而且能够发现一些表达模式变化趋势相似的共调控基因。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号