首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 203 毫秒
1.
蛋白质复合物对于生物学家有效了解细胞组织和功能具有重要意义,如何通过计算方法从蛋白质-蛋白质相互作用(PPI)网络中识别复合物是当前研究热点之一。然而,由于PPI网络中存在大量假阴性和假阳性噪声数据且现有已知蛋白质复合物并不完整,使得如何克服PPI网络的噪声问题,以及更好地利用已知蛋白质复合物,成为蛋白质复合物识别亟待解决的关键问题。为此,该文提出一种基于蛋白质复合物拓扑信息,利用监督学习进行蛋白质复合物识别的算法(NOBEL)。首先,NOBEL根据蛋白质的生物信息和拓扑信息构建加权PPI网络,降低了网络中的噪声问题;然后,通过加权PPI网络和未加权PPI网络提取复合物拓扑信息作为特征,并根据提取的特征训练监督学习模型,使得监督学习模型能有效学习复合物蕴含的信息;最后,将训练好的模型应用于PPI网络识别蛋白质复合物。作者在四种真实PPI网络上进行了实验,实验结果表明,NOBEL与其他七种蛋白质复合物识别算法相比,在F-measure方面分别至少提高了4.39%(Gavin)、1.32%(DIP)、2.39%(WI-PHI_core)和2.34%(WI-PHI_extend)。  相似文献   

2.
朱海湾 《计算机应用研究》2020,37(2):390-397,420
针对基于蚁群聚类的蛋白质复合物挖掘算法中,静态PPI网络难以真实反映细胞的动态特性,收敛速度较慢、聚类准确性和召回率不高等问题,提出一种基于模糊粒度和紧密度的蚁群聚类动态加权PPI网络复合物挖掘方法(FGCDACC-DPC)。首先基于动态PPI网络的拓扑特性和生物特性设计了综合性权值度量(comprehensive weight metric,CWM),准确描述了蛋白质之间的相互作用;其次根据复合物的基本特征,构建一组稠密且高度共表达的复合核,然后设计模糊粒度和紧密度的拾起放下模型对其余节点聚类,降低了计算复杂度和随机性,加快聚类速度;最后基于功能信息传递和时序功能相关的思想分别构建了局部和全局权值更新策略,实现不同代蚁群和不同时刻网络之间的功能信息传递,提高聚类准确性。将FGCDACC-DPC算法应用在DIP数据上进行复合物挖掘,实验结果表明该算法的精度和召回率较高,能够较准确地识别蛋白质复合物。  相似文献   

3.
与静态PPI网络相比,动态PPI网络更能体现蛋白质之间相互作用的真实情况,并有效降低PPI网络中的假阴性。现有的关键蛋白质预测方法主要应用在静态PPI网络,忽视了PPI网络的动态特性。为有效预测关键蛋白质,利用基因表达数据提取蛋白质的动态信息,再结合静态PPI网络构建动态PPI网络,然后引入GO术语对网络加权,并基于动态加权PPI网络提出一种新的预测方法-DWE。该方法以蛋白质在动态网络中的动态加权边之和与蛋白质在动态网络中出现的次数的比值衡量蛋白质在网络中的关键性。实验结果表明动态加权PPI网络有助于提高关键蛋白质的预测精度,且DWE方法优于其他几种关键蛋白质预测方法。  相似文献   

4.
针对蛋白质相互作用(protein-protein interaction,PPI)网络中存在大量噪声以及现有关键蛋白识别方法准确率不高等问题,提出了一种基于中心性和模块特性(united centrality and modularity,UCM)的方法来识别关键蛋白质。首先,整合蛋白质拓扑数据和生物数据构建多元属性网络,以降低PPI网络中噪声的影响;其次,根据关键蛋白质的拓扑特性和生物特性,提出一种挖掘稠密且高度共表达的关键模块算法,从多元属性网络中挖掘高可靠性的关键模块,以从多维角度强化关键蛋白质在模块中的重要程度;最后,整合蛋白质的中心性和模块化特性,设计一种衡量蛋白质关键性的策略(essential integration strategy,EIS),以提高识别高关键蛋白质的准确率。UCM方法应用在DIP数据集上进行验证,实验结果表明,与其他10种关键蛋白质识别方法相比较,该方法具有较好的识别性能,能够识别更多的关键蛋白质。  相似文献   

5.
针对在蛋白质相互作用网络上的关键蛋白质识别只关注拓扑特性,蛋白质相互作用数据中存在较高比例的假阳性数据以及基于复合物信息的关键蛋白质识别算法对节点的邻域信息和复合物的挖掘对关键蛋白质的识别影响效果考虑不够全面等导致的识别准确率和特异性不高的问题,提出一种基于复合物参与度和密度的关键蛋白质预测算法PEC。首先融合GO注释信息和边聚集系数构造加权PPI网络,克服假阳性对实验结果的影响;基于蛋白质相互作用的边权重,构造相似度矩阵,设计特征值间的最大本征差值来自动确定划分数目K,同时根据加权网络中的蛋白质节点度来选取K个初始聚类中心,进而利用谱聚类结合模糊C-means聚类算法实现复合物的挖掘,提高聚类的准确率,降低数据的维数;其次基于蛋白质节点的复合物参与度以及节点邻域子图密度,设计出关键节点的关键性得分。在DIP和Krogan 2个数据集上,将PEC与DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10种经典算法相比,实验结果表明,PEC算法能够识别出更多的关键蛋白质,且聚类结果的准确率和特异性较高。  相似文献   

6.
动态蛋白质网络的构建和复合物识别问题是生物信息学领域目前研究的热点.针对现有的算法在解决前述问题上的不足,提出了一种基于隐马尔科夫模型的蛋白质复合物识别算法(HMM-PC).首先基于蛋白质的基因共表达特性构建初始蛋白质网络,然后利用蛋白质的共享功能注释、共享结构域和连接强度等信息来对网络进行加权,得到动态蛋白质网络.在此基础上,考虑前一时刻蛋白质网络拓扑结构信息对当前时刻蛋白质网络拓扑结构信息的影响,采用隐马尔科夫模型描述蛋白质复合物与网络个体间的相互关系,进而将动态蛋白质网络中的复合物识别问题建模为隐马尔科夫模型中的最优状态序列发现问题,并采用维特比算法识别得到蛋白质复合物.最后通过理论分析证明了所提算法的复杂度较低.采用DIP数据集和MIPS数据集中的酵母蛋白质网络作为测试对象,大量的仿真实验结果也表明,HMM-PC算法的鲁棒性较强,在查全率、查准率、F-measure和效率等方面的性能都要优于现有的复合物识别算法.  相似文献   

7.
洪海燕  刘维 《计算机科学》2017,44(10):38-44
关键蛋白质是生物体内维持所有生命活动最重要的物质基础。随着高通量技术的发展,如何从蛋白质相互作用网络中识别出关键蛋白质成为目前蛋白质组学的研究热点。针对大部分现有方法仅仅基于网络拓扑结构信息进行识别以及蛋白质相互作用数据假阳性高的问题,提出了改进的粒子群算法来识别关键蛋白质。通过综合考虑网络拓扑结构特性和多源生物属性信息构建了高质量的加权网络,还考虑使用蛋白质节点间联系的紧密程度来衡量蛋白质的关键性,并扩展局部网络拓扑至二阶邻居,大大提高了预测的准确率。提出了衡量top-p关键蛋白质的整体性指标,降低了计算复杂度。在标准数据集上的实验结果表明,与其他经典算法相比,所提算法更具优势,能够识别出更多的蛋白质,具有较高的准确率。  相似文献   

8.
关键蛋白质的识别对于理解细胞的生长调控过程、疾病研究和药物设计等方面具有重要的意义。随着高通量技术的发展,越来越多的蛋白质相互作用数据被获取,使得可以从网络水平上研究关键蛋白质。目前,许多基于蛋白质网络拓扑特征的算法被提出,但是这类方法忽略了蛋白质网络的生物信息和假阴性、假阳性数据的影响。因此,论文通过结合蛋白质结构域和蛋白质网络的拓扑特征提出了一种新的算法Do-ECC。实验结果表明,Do-ECC明显优于其他8种算法(D C,BC,CC,SC,EC,IC,LAC,NC)。  相似文献   

9.
蛋白质复合物是许多生物过程得以实现的基石。蛋白质相互作用数据中的假阳性和假阴性对各种识别蛋白质复合物的计算方法有不良影响。为了解决这一问题,1种新的蛋白质复合物识别算法(ICMDS,Identifying Complexes based on Multiple Data Sources)被提出。该方法整合基因表达谱、关键蛋白质信息和蛋白质相互作用3种生物数据进行蛋白质复合物的挖掘。首先,ICMDS重新定义了2个相互作用的蛋白质之间的功能相似性(FS,Functional Similarity)。然后,ICMDS选择已知的关键蛋白质作为种子构建蛋白质复合物。为了消除冗余的复合物,ICMDS算法也设计了冗余过滤子程序。另外,ICMDS也使用非关键蛋白质作为种子并将之扩展为蛋白质复合物。实验结果表明ICMDS识别蛋白质复合物的能力明显优于其他计算方法。  相似文献   

10.
胡赛  熊慧军  赵碧海  李学勇  王晶 《自动化学报》2015,41(11):1893-1900
一个蛋白质可能在不同条件或不同时刻与不同的蛋白质发生相互作用,这称为蛋白质的动态特性.蛋白质在分子处理的不同阶段参与到不同的模块,与其他的蛋白质共同完成某项功能.因此, 动态蛋白质相互作用的研究有助于提高蛋白质功能预测的准确率.结合蛋白质相互作用网络和时间序列基因表达数据,构建动态蛋白质相互作用网络.为降低PPI网络中假阴性对功能预测产生的负面影响,结合结构域信息和复合物信息,预测和产生新的相互作用,并对相互作用加权.基于构建的动态加权网络,提出一种功能预测方法D-PIN (Dynamic protein interaction networks). 基于三个不同的酵母相互作用网络实验结果表明, D-PIN 方法的综合性能比现有方法提高了14%以上.结果验证了构建的动态加权蛋白质相互网络的有效性.  相似文献   

11.
洪海燕  刘维 《计算机科学》2016,43(Z11):16-20, 25
关键蛋白质对于细胞生活是不可缺少的,识别关键蛋白质可以帮助了解细胞生活的最小需求,同时对药物设计也有非常大的作用。随着高通量技术的发展,人们可得到越来越多的蛋白质-蛋白质相互作用(PPI)的数据,这就使得可以在网络层次上来研究关键蛋白质。目前,学术界已经提出了一系列的计算方法来识别关键蛋白质,但这些方法并没有完全解决蛋白质相互作用数据的假阳性问题。除此之外,现有方法一般只考虑了网络的拓扑结构,对于生物信息的考虑,目前还是比较欠缺的。蛋白质对于人类细胞的生命活动不仅仅与网络拓扑结构有关,还和蛋白质在网络上的生物信息相关。因此,针对以上问题,提出了一种高效的预测关键蛋白质的新方法EPP(Essential Proteins Predict),该方法通过计算蛋白质在PPI网络中的重要性来进行预测,蛋白质的重要性越高,成为关键蛋白质的可能性就越大。取重要性排名前P%的蛋白质作为关键蛋白质,在进行蛋白质重要性的计算时,综合考虑语义相似度及可信度因素,以综合考虑网络的拓扑结构与蛋白质本身的生物信息。实验结果表明,与其他传统方法相比,提出的新方法复杂度较低,且能够识别出更多的关键蛋白质,并且其统计指标也高于其他的方法。  相似文献   

12.
当前可用的生物数据在不断地迅速增长,仍有很多生物信息如蛋白质交互信息(protein-protein interac-tion,PPI)还未被发现,而这些潜在的或未知的信息对生物过程的研究是至关重要的。近年来,对未知生物信息的挖掘和研究吸引了很多人的关注。通过实验检测方法来发现这些信息是非常耗时耗力的,所以链接预测成为一种新的挖掘这些信息的指导方法。基于蛋白质交互网络并融合了基因表达数据信息,从拓扑和基因表达两个方面的信息来构建PPI权值网络,提出了一种在权值网络中基于相似度比较的链接预测的新方法来预测PPI网络中未知的交互信息。使用MIPS数据库评估了实验结果,表明了该算法有很好的准确率和良好的性能。  相似文献   

13.
Protein–protein interaction (PPI) networks are dynamic in the real world. That is, at different times and under different conditions, the interaction among proteins may or may not be active. In different dataset, PPI networks might be gathered as static or dynamic networks. For the conversion of static PPI networks to time graphs, i.e., dynamic PPI networks, additional information like gene expression and gene co-expression profiles is used. One of the challenges in system biology is to determine appropriate thresholds for converting static PPI networks to dynamic PPI networks based on active proteins. In the available methods, fixed thresholds are used for all genes. However, the purpose of this study is to determine an adaptive unique threshold for each gene. In this study, the available additional information at different times and conditions and gold-standard protein complexes was employed to determine fitting thresholds. By so doing, the problem is converted into an optimization problem. Thereafter, the problem is solved using the firefly meta-heuristic optimization algorithm. One of the most remarkable aspects of this study is determining the attractiveness function in the firefly algorithm. In this study, attraction is defined as a combination of standard complexes and gene co-expressions. Then, active proteins are specified utilizing the created thresholds. The MCL, ClusterOne, MCODE and Coach algorithms are used for final evaluation. The experimental results about BioGRID dataset and CYC2008 gold-standard protein complexes indicated that the produced dynamic PPI networks by the proposed method have better results than the earlier methods.  相似文献   

14.
Protein complexes play important roles in integrating individual gene products to perform useful cellular functions.The increasing mount of protein–protein interaction(PPI)data has enabled us to predict protein complexes.In spite of the advances in these computational approaches and experimental techniques,it is impossible to construct an absolutely reliable PPI network.Taking into account the reliability of interactions in the PPI network,we have constructed a weighted protein–protein interaction(WPPI)network,in which the reliability of each interaction is represented as a weight using the topology of the PPI network.As overlaps are likely to have biological importance,we proposed a novel method named WN-PC(weighted network-based method for predicting protein complexes)to predict overlapping protein complexes on the WPPI network.The proposed algorithm predicts neighborhood graphs with an aggregation coefficient over a threshold as candidate complexes,and binds attachment proteins to candidate complexes.Finally,we have filtered redundant complexes which overlap other complexes to a very high extent in comparison to their density and size.A comprehensive comparison between competitive algorithms and our WN-PC method has been made in terms of the F-measure,coverage rate,and P-value.We have applied WN-PC to two different yeast PPI data sets,one of which is a huge PPI network consisting of over 6000 proteins and 200000 interactions.Experimental results show that WN-PC outperforms the state-of-the-art methods.We think that our research may be helpful for other applications in PPI networks.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号