首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 421 毫秒
1.
蛋白质相互作用(PPI)网络是生物信息学的一个新的研究领域。近年来谱聚类算法在未知蛋白质的功能预测方面发挥了重要作用,但是它要求事先确定聚类数目,为此提出了一种基于边的得分搜索的谱聚类算法。该算法采用谱聚类方法对数据进行预处理,并通过构造蛋白质节点之间的边的得分矩阵找到数据样本之间的相关性,同时融入粒子群算法来确定边的得分的最佳选择阈值,最后用广度优先遍历结点的方法得到聚类结果。算法在PPI网络数据集上进行了测试,结果表明该算法不但可以自动确定聚类数目,而且聚类结果的正确率和F-measure值都得到了提高。  相似文献   

2.
在蛋白质相互作用(Protein-Protein Interaction,PPI)网络中检测蛋白质功能模块有助于预测未知蛋白质的功能模块。随着蛋白质相互作用有效数据迅速增长,如何通过PPI网络获得有效的蛋白质功能模块成为最大挑战。阐述PPI网络的发展及现状,通过对当前蛋白质功能模块检测算法进行归纳总结,把它们分为单元聚类和多元聚类,并对每类的代表性方法进行详细阐述;讨论蛋白质相互作用网络功能模块检测研究所面临的挑战及未来研究方向。  相似文献   

3.
朱海湾 《计算机应用研究》2020,37(2):390-397,420
针对基于蚁群聚类的蛋白质复合物挖掘算法中,静态PPI网络难以真实反映细胞的动态特性,收敛速度较慢、聚类准确性和召回率不高等问题,提出一种基于模糊粒度和紧密度的蚁群聚类动态加权PPI网络复合物挖掘方法(FGCDACC-DPC)。首先基于动态PPI网络的拓扑特性和生物特性设计了综合性权值度量(comprehensive weight metric,CWM),准确描述了蛋白质之间的相互作用;其次根据复合物的基本特征,构建一组稠密且高度共表达的复合核,然后设计模糊粒度和紧密度的拾起放下模型对其余节点聚类,降低了计算复杂度和随机性,加快聚类速度;最后基于功能信息传递和时序功能相关的思想分别构建了局部和全局权值更新策略,实现不同代蚁群和不同时刻网络之间的功能信息传递,提高聚类准确性。将FGCDACC-DPC算法应用在DIP数据上进行复合物挖掘,实验结果表明该算法的精度和召回率较高,能够较准确地识别蛋白质复合物。  相似文献   

4.
针对在蛋白质相互作用网络上的关键蛋白质识别只关注拓扑特性,蛋白质相互作用数据中存在较高比例的假阳性数据以及基于复合物信息的关键蛋白质识别算法对节点的邻域信息和复合物的挖掘对关键蛋白质的识别影响效果考虑不够全面等导致的识别准确率和特异性不高的问题,提出一种基于复合物参与度和密度的关键蛋白质预测算法PEC。首先融合GO注释信息和边聚集系数构造加权PPI网络,克服假阳性对实验结果的影响;基于蛋白质相互作用的边权重,构造相似度矩阵,设计特征值间的最大本征差值来自动确定划分数目K,同时根据加权网络中的蛋白质节点度来选取K个初始聚类中心,进而利用谱聚类结合模糊C-means聚类算法实现复合物的挖掘,提高聚类的准确率,降低数据的维数;其次基于蛋白质节点的复合物参与度以及节点邻域子图密度,设计出关键节点的关键性得分。在DIP和Krogan 2个数据集上,将PEC与DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10种经典算法相比,实验结果表明,PEC算法能够识别出更多的关键蛋白质,且聚类结果的准确率和特异性较高。  相似文献   

5.
针对蚁群融合模糊C-means (FCM)聚类算法在蛋白质相互作用网络中进行复合物识别的准确率不高、召回率较低以及时间性能不佳等问题进行了研究,提出一种基于模糊蚁群的加权蛋白质复合物识别算法FAC-PC(algorithm for identifying weighted protein complexes based on fuzzy ant colony clustering)。首先,融合边聚集系数与基因共表达的皮尔森相关系数构建加权网络;其次提出EPS(essential protein selection)度量公式来选取关键蛋白质,遍历关键蛋白质的邻居节点,设计蛋白质适应度PFC(protein fitness calculation)来获取关键组蛋白质,利用关键组蛋白质替换种子节点进行蚁群聚类,克服蚁群算法中因大量拾起放下和重复合并过滤操作而导致准确率和收敛速度过慢的缺陷;接着设计SI(similarity improvement)度量优化拾起放下概率来对节点进行蚁群聚类进而获得聚类数目;最后将关键蛋白质和通过蚁群聚类得到的聚类数目初始化FCM算法,设计隶属度更新策略来优化隶属度的更新,同时提出兼顾类内距和类间距的FCM迭代目标函数,最终利用改进的FCM完成复合物的识别。将FAC-PC算法应用在DIP数据上进行复合物的识别,实验结果表明FAC-PC算法的准确率和召回率较高,能够较准确地识别蛋白质复合物。  相似文献   

6.
基于模糊聚类的文本挖掘算法   总被引:8,自引:3,他引:5       下载免费PDF全文
针对传统FCM算法对孤立点比较敏感,须预先指定聚类数目的缺陷,提出一种新的模糊聚类算法NSFCM,将其应用干文本挖掘中。NSFCM对数据对象的隶属度增加一个权值,以减少孤立点对聚类中心的影响。采用平均信息熵确定聚类数,通过密度函数获得初始聚类中心。仿真结果证明,该算法聚类的精度和执行效率均高于FCM算法,效果较好。  相似文献   

7.
基于模糊K-harmonic means的谱聚类算法   总被引:1,自引:0,他引:1  
谱聚类作为一种有效的方法广泛应用于机器学习。通过分析谱聚类初始化敏感的实质,引入对初值不敏感的模糊K-harmonic means算法来克服这一缺点,提出一种基于模糊K-harmonic means的谱聚类算法(FKHM-SC)。与传统谱聚类算法以及对初值敏感的K-means、FCM算法相比,改进算法不仅可以识别有挑战性的人工数据,并且可以得到稳定的聚类中心和聚类结果,同时提高了聚类的精确度。实验结果表明了该算法的有效性和可行性。  相似文献   

8.
一种基于隶属度优化的演化聚类算法   总被引:1,自引:0,他引:1  
针对FCM中数据点隶属度的计算是影响算法执行效率的主要因素,提出一种新的加速FCM算法(accelerated fuzzy C-means,AFCM),用于加速FCM及基于FCM的演化聚类算法.AFCM算法采用抽样初始化操作,产生较好的初始聚类中心,对于拥有较大隶属度的数据点,通过一步k-means操作更新模糊聚类中心,同时仅更新小隶属度来达到加速FCM算法的目的.为了验证所提出方法的有效性并提高聚类算法的效率,将AFCM应用于基于演化算法的模糊聚类算法.实验表明,此方法在保持良好的聚类结果前提下,能够减少大规模数据集上聚类算法的计算时间.  相似文献   

9.
研究表明使用PPI数据进行蛋白质功能预测是很有意义的。然而,从生物学实验得到的PPI数据一般是含有噪声的、不完全的和不精确的,这使得将PPI网络作为不确定图来处理变得更加合理。提出了一种基于深度优先搜索策略和点扩展的挖掘算法,它可以有效地从不确定的PPI网络中挖掘最大稠密子图。该算法使用了几种高效的剪枝技术来提高挖掘的时间效率。在酵母菌PPI数据上的实验结果表明该算法在精度和效率上都有很好的表现。  相似文献   

10.
红外图像具有对比度低和信噪比低等特点,这对红外光伏面板图像的分割始终是一个巨大的挑战.为了解决传统的模糊C均值(FCM)聚类算法易受到初始聚类中心不确定的影响和不考虑空间信息的问题,提出了一种基于模糊C均值改进的聚类分割算法,该算法利用直方图的特点确定初始聚类中心,同时在传统的模糊C均值(FCM)和模糊核C均值算法(KFCM)的基础上,利用像素之间的空间信息和邻域像素之间的关系改进传统FCM聚类目标函数,从而推导出新的目标函数.实验结果表明,该算法在分割质量和效果上与Otsu算法、文献[20]的自适应k-means算法及模糊核C均值算法(KFCM)相比,过分割和错分割率明显降低,且分割效果非常接近手动分割图.  相似文献   

11.
针对无线传感器网络(WSN)的节点能量有限、生命周期短、吞吐量低等问题,提出一种基于遗传算法(GA)和模糊C均值(FCM)聚类的WSN分簇路由算法GAFCMCR,采取"集中分簇,分布簇头选举"的方式。网络初始化时基站采用由GA优化的FCM聚类算法形成网络分簇。第一轮簇头由距簇中心最近的节点担任;从第二轮开始,簇头的选举由上一轮的簇头负责,选举过程综合考虑候选节点的剩余能量、与基站的距离、与簇内其他节点的平均距离三个因子,并根据网络状态实时调整三个因子的权重。在数据传输阶段,将轮询机制引入簇内通信。仿真结果表明,相同网络环境下,与LEACH算法和基于K-Means的均匀分簇路由(KUCR)算法相比,GAFCMCR将网络生命周期延长了105%和20%。GAFCMCR成簇效果良好,具有良好的能量均衡性和更高的吞吐量。  相似文献   

12.
一种遗传模糊聚类算法及其应用   总被引:2,自引:1,他引:1  
宋娇  葛临东 《计算机应用》2008,28(5):1197-1199
研究一种基于遗传算法的模糊聚类方法,即将遗传算法得到的聚类中心作为模糊C-均值(FCM)聚类算法初值,这样既可以克服FCM算法对初始中心敏感的缺点,也可以解决遗传算法只能找到近似解的问题。将算法用于通信信号的星座聚类,根据聚类有效性函数自适应地确定聚类中心,并完成信号类型的识别。仿真实验证明,当存在较小的定时误差时,算法对PSK和QAM信号仍然是有效的。  相似文献   

13.
针对现有的基于蛋白质相互作用(PPI)网络的蛋白质功能预测方法预测精度不高、易受数据噪声影响的问题,提出一种基于机器学习(层次聚类、主成分分析和多层感知器)的蛋白质功能预测方法HPMM。该方法综合考虑蛋白质宏观和微观层面的信息,将蛋白质家族、结构域和重要位点信息作为顶点属性整合到PPI网络中以减轻网络中数据噪声的影响。首先,基于层次聚类和主成分分析进行特征提取,得到功能模块和属性主成分特征,然后训练多层感知器模型,建立多特征与多功能之间的映射关系以用于功能预测。在三个分别被分子功能(MF)、生物过程(BP)和细胞组件(CC)注释的人类PPI网络上进行测试,对HPMM、余弦迭代算法(CIA)和有向PPI网络基因本体术语传播(GoDIN)算法的功能预测效果进行比较分析。实验结果表明,相比CIA和GoDIN这两种完全基于PPI网络的方法,HPMM的精确度与F值更高。  相似文献   

14.
针对模糊C-均值(FCM)算法不能很好地处理更新数据的缺点,提出基于FCM的自适应增量式聚类算法AIFCM。该算法结合密度和集合的思想,给出一种自动确定聚类初始中心的方法,能在聚类过程中动态改变聚类结果数,改善聚类的质量,减少人为的主观因素,获得比较符合用户需求的聚类结果,并能在原有聚类结果的基础上简单有效地处理更新数据,过滤噪声数据,较好地避免大量重复计算。  相似文献   

15.
聚类技术是机器学习、模式识别及数据挖掘等领域中的一个重要研究内容。采用不同相似度测量方式,应用标准模糊C均值聚类算法在UCI的三个知名数据集上完成聚类实验,从正确率和运行效率两个方面对比分析其性能,为聚类分析研究提供了有益的参考。  相似文献   

16.
针对核模糊C-均值(KFCM)聚类算法存在易陷入局部极小值,对初始值敏感的缺点。将混合蛙跳算法(shuffled frog leaping algorithm,SFLA)用于KFCM中,但在聚类数较大和维数较高时,聚类效果不理想,为此提出将自适应惯性权重引入混合蛙跳算法的更新策略中,再用改进后的混合蛙跳算法求得最优解作为KFCM算法的初始聚类中心,利用KFCM算法优化初始聚类中心,求得全局最优解,从而有效克服了KFCM算法的缺点。人造数据和经典数据集的实验结果表明,新算法与KFCM和FCM聚类算法相比,寻优能力更强,迭代次数更少,聚类效果更好。  相似文献   

17.
针对模糊C均值(FCM)聚类算法具有初始聚类中心敏感和容易陷入局部最优的问题,提出了一种基于改进遗传算法(GA)的加权模糊c均值聚类算法,采用高斯变异算子,提高了遗传算法在每个峰值附近的局部搜索能力,用基于复相关系数的加权欧式距离代替欧式距离,改进了FCM算法的聚类目标函数.用改进的算法对国际标准测试数据Iris进行测试,实验结果表明改进后的算法具有更好的稳定性和健壮性,提高了聚类的效果.  相似文献   

18.
Based on clonal selection principle and the immunodominance theory, a new immune clustering algorithm, Immunodomaince based Clonal Selection Clustering Algorithm (ICSCA) is proposed in this paper. Firstly, by introducing a new immunodomaince operator to Clonal Selection Algorithm (CSA), the gene of elites in antibody population can be extracted and generalized to ordinary antibodies so as to gain on-line priori knowledge and share information among individuals. Then, one iteration of Fuzzy C-means clustering algorithm (FCM) and adaptive updating mechanism of antibody population are utilized to improve the diversity of antibody population in order to speed up the convergence speed. The proposed method has been extensively compared with FCM, GA-clustering algorithm (GACA) and Clonal Selection Algorithm based FCM (CSAFCM) over a test suit of several real life data sets and synthetic data sets. Experimental results indicate the superiority of the ICSCA over FCM, GAFCM and CSAFCM on clustering accuracy and robustness.  相似文献   

19.
针对无监督聚类缺少数据分类等先验信息、基聚类的准确性受聚类算法影响以及一般聚类融合算法空间复杂度高的问题,提出一种基于改进遗传算法的聚类融合算法(CEIGA);同时针对传统聚类融合算法已经不能满足大规模数据处理对于时间的要求的问题,提出一种云计算下使用Hadoop平台的基于改进遗传算法的并行聚类融合算法(PCEIGA)。首先,基聚类生成机制产生的基聚类划分在完成簇标签转化后进行基因编码作为遗传算法的初始种群。其次,通过改进遗传算法的选择算子,保证基聚类的多样性;再根据改进的选择算子对染色体进行交叉和变异操作并使用精英策略得到下一代种群,保证基聚类的准确性。如此循环,使聚类融合最终结果达到全局最优,提高算法准确度。通过设计两个MapReduce过程并加入Combine过程减少节点通信,提高算法运行效率。最后,在UCI数据集上比较了CEIGA、PCEIGA和四个先进的聚类融合算法。实验结果表明,与先进的聚类融合算法相比,CEIGA性能最好;而PCEIGA能在不影响聚类结果准确度的前提下明显降低算法运行时间,提高算法效率。  相似文献   

20.
基于GEP的遥感数字图像模糊聚类研究   总被引:3,自引:1,他引:2       下载免费PDF全文
针对遥感信息的不确定性和混合像元问题,分析FCM算法。为了避免FCM初值选取不当而陷入局部最优,提出基于基因表达式编程的遥感数字图像模糊聚类算法。该算法可以利用外层GEP算法的全局寻优能力,确定最佳初始聚类中心,再利用内层FCM算法的模糊聚类和局部快速收敛的特性获得遥感数字图像的最优聚类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号