首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
在蛋白质相互作用(Protein-Protein Interaction,PPI)网络中检测蛋白质功能模块有助于预测未知蛋白质的功能模块。随着蛋白质相互作用有效数据迅速增长,如何通过PPI网络获得有效的蛋白质功能模块成为最大挑战。阐述PPI网络的发展及现状,通过对当前蛋白质功能模块检测算法进行归纳总结,把它们分为单元聚类和多元聚类,并对每类的代表性方法进行详细阐述;讨论蛋白质相互作用网络功能模块检测研究所面临的挑战及未来研究方向。  相似文献   

2.
现有关键蛋白质识别算法对生物信息考虑不全面、识别准确率亦有待提高,针对此问题,提出一种高效关键蛋白质识别算法PDWS。首先,结合由亚细胞定位信息获取到的蛋白质位置和蛋白质相互作用网络边聚类系数构建加权网络;其次,依据蛋白质所处亚细胞位置,提出亚细胞定位区室子网参与度指标;最后,融合亚细胞定位区室子网参与度和蛋白质复合物子网参与度指标,多维度度量蛋白质关键性。在DIP和Krogan两个标准数据集上的实验结果表明,PDWS算法性能优于PeC、PCSD等已有算法,可识别出更多特定结构的关键蛋白质,且识别精度分别达到0.76与0.73。  相似文献   

3.
基于蛋白质相互作用网络的聚类算法研究   总被引:1,自引:0,他引:1  
蛋白质相互作用网络是计算机科学技术的一个新研究领域。蛋白质相互作用网络中结点之间的距离度量需要通过基于网络的最短路径距离来重新定义,其计算代价高,这使得已有的基于欧几何距离的聚类算法不能直接运用到这种环境中。因此,通过蛋白质相互作用网络的特征提出了一种新的聚类算法。算法使用网络中的边和结点信息来缩减搜索空间,避免了一些不必要的距离计算。实验结果表明,算法对于真实的蛋白质相互作用网络中的结点聚类是高效的。  相似文献   

4.
关键蛋白质作为蛋白质中的关键物质,不仅对研究细胞生长调控有着重要意义,也为更深层次的疾病研究奠定理论基础.目前,针对关键蛋白质的识别方法大多为应用基因表达信息和蛋白质相互作用网络,提出识别关键蛋白质的静态和动态网络方法,但这些方法未考虑基因表达调控的周期性规律,无法准确地刻画受基因周期调控的蛋白质网络.为此,在基因表达动态性的基础上引入了基因周期性表达的概念,提出了一种动态网络切分方法.该方法通过构建基因“活性”表达矩阵,利用切分后的“活性”表达矩阵作用于蛋白质相互作用网络,从而形成蛋白质周期子网络,最终综合各周期子网络来衡量蛋白质结点在网络中的重要性.实验结果表明,该方法在酵母、大肠杆菌和人类膀胱数据中可以有效地提高关键蛋白质预测率.  相似文献   

5.
陶斯涵  丁彦蕊 《软件学报》2019,30(11):3413-3426
残基相互作用网络比对,对于研究蛋白质结构与功能的关系具有重要意义.在基于网络拓扑信息进行网络比对的MAGNA算法基础上,将蛋白质的序列信息(即残基匹配度)引入到其优化函数中,确定拓扑信息和序列信息对比对的影响程度,提出适合于残基相互作用网络比对的SI-MAGNA算法.实验结果表明,SI-MAGNA算法比现有的基于网络拓扑信息的经典比对方法(GRAAL、MI-GRAAL、MAGNA和CytoGEDEVO)具有更高的边正确性(edge correctness,简称EC).最后,使用SI-MAGNA算法对来自不同耐热温度的生物的同源蛋白质进行网络比对和分析,探索蛋白质结构对其热稳定性的影响.  相似文献   

6.
洪海燕  刘维 《计算机科学》2016,43(Z6):413-417, 434
蛋白质间的相互作用预测问题本质上是复杂网络的链接预测问题。到目前为止,已经有很多方法用于链接预测,这些方法要么只考虑拓扑信息,要么只考虑蛋白质相互作用网络内部的交互信息,但是仅考虑一种信息来预测蛋白质的交互信息是远远不够的。因此提出了一种新方法:将蛋白质相互作用网络看作是一个有权图,根据网络中两节点的拓扑结构和属性信息,分别计算它们的拓扑相似度和属性相似度来预测它们之间是否存在链接关系。在两种相似度平衡方面,考虑基于空间映射的方法,将它们独立地映射到另一空间,并且使它们分别映射的空间尽量相近,从而使得拓扑信息、属性信息有机融合。实验结果表明,提出的算法具有较好的准确率和良好的生物统计特性。  相似文献   

7.
蛋白质相互作用网络的蜂群信息流聚类模型与算法   总被引:1,自引:0,他引:1  
蛋白质相互作用网络的聚类算法研究是充分理解分子的结构、功能及识别蛋白质的功能模块的重要方法.很多传统聚类算法对于蛋白质相互作用网络聚类效果不佳.功能流模拟算法是一种新型聚类算法,但该算法没有考虑到距离的作用效果并且需要人为地设置合并阈值,带有主观性.文中提出了一种新颖的基于蜂群优化机理的信息流聚类模型与算法.该方法中,数据预处理采用结点网络综合特征值的排序来初始化聚类中心,将蜂群算法的蜜源位置对应于其聚类中心,蜜源的收益度大小对应于模块间的相似度,采蜜蜂结点的所有邻接点按照结点网络综合特征值的降序排列,作为侦察蜂的搜索邻域.采用正确率、查全率等指标对聚类效果做出客观评价,并对算法的一些关键参数进行仿真、对比与分析.结果表明新算法不仅克服了原功能流模拟算法的缺点,且其正确率和查全率的几何平均值最高,能够有效地识别蛋白质功能模块.  相似文献   

8.
洪海燕  刘维 《计算机科学》2017,44(10):38-44
关键蛋白质是生物体内维持所有生命活动最重要的物质基础。随着高通量技术的发展,如何从蛋白质相互作用网络中识别出关键蛋白质成为目前蛋白质组学的研究热点。针对大部分现有方法仅仅基于网络拓扑结构信息进行识别以及蛋白质相互作用数据假阳性高的问题,提出了改进的粒子群算法来识别关键蛋白质。通过综合考虑网络拓扑结构特性和多源生物属性信息构建了高质量的加权网络,还考虑使用蛋白质节点间联系的紧密程度来衡量蛋白质的关键性,并扩展局部网络拓扑至二阶邻居,大大提高了预测的准确率。提出了衡量top-p关键蛋白质的整体性指标,降低了计算复杂度。在标准数据集上的实验结果表明,与其他经典算法相比,所提算法更具优势,能够识别出更多的蛋白质,具有较高的准确率。  相似文献   

9.
针对在蛋白质相互作用网络上的关键蛋白质识别只关注拓扑特性,蛋白质相互作用数据中存在较高比例的假阳性数据以及基于复合物信息的关键蛋白质识别算法对节点的邻域信息和复合物的挖掘对关键蛋白质的识别影响效果考虑不够全面等导致的识别准确率和特异性不高的问题,提出一种基于复合物参与度和密度的关键蛋白质预测算法PEC。首先融合GO注释信息和边聚集系数构造加权PPI网络,克服假阳性对实验结果的影响;基于蛋白质相互作用的边权重,构造相似度矩阵,设计特征值间的最大本征差值来自动确定划分数目K,同时根据加权网络中的蛋白质节点度来选取K个初始聚类中心,进而利用谱聚类结合模糊C-means聚类算法实现复合物的挖掘,提高聚类的准确率,降低数据的维数;其次基于蛋白质节点的复合物参与度以及节点邻域子图密度,设计出关键节点的关键性得分。在DIP和Krogan 2个数据集上,将PEC与DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10种经典算法相比,实验结果表明,PEC算法能够识别出更多的关键蛋白质,且聚类结果的准确率和特异性较高。  相似文献   

10.
胡赛  熊慧军  赵碧海  李学勇  王晶 《自动化学报》2015,41(11):1893-1900
一个蛋白质可能在不同条件或不同时刻与不同的蛋白质发生相互作用,这称为蛋白质的动态特性.蛋白质在分子处理的不同阶段参与到不同的模块,与其他的蛋白质共同完成某项功能.因此, 动态蛋白质相互作用的研究有助于提高蛋白质功能预测的准确率.结合蛋白质相互作用网络和时间序列基因表达数据,构建动态蛋白质相互作用网络.为降低PPI网络中假阴性对功能预测产生的负面影响,结合结构域信息和复合物信息,预测和产生新的相互作用,并对相互作用加权.基于构建的动态加权网络,提出一种功能预测方法D-PIN (Dynamic protein interaction networks). 基于三个不同的酵母相互作用网络实验结果表明, D-PIN 方法的综合性能比现有方法提高了14%以上.结果验证了构建的动态加权蛋白质相互网络的有效性.  相似文献   

11.
封二英  牛耘  魏欧 《计算机应用》2012,32(Z1):147-150
针对目前蛋白质交互(PPI)关系提取方法仅以单句中的信息为主要依据的问题,提出一种基于大规模文本的蛋白质交互关系自动提取的方法.首先通过对大规模生物医学文本的自动搜索建立目标蛋白质对的签名档,将蛋白质交互关系抽取转化为文本自动分类问题;然后提取签名档中的重要特征,建立蛋白质对的向量空间模型(VSM);最后采用支持向量机(SVM)对签名档进行分类.比较了四种对向量的特征进行加权和特征选择的方案.实验表明,基于大规模文本的蛋白质交互关系识别取得了最高达94.8%的精确度和65.1%的召回率;并且此方法充分利用已有的交互信息,免除了额外的人工标注的负担.  相似文献   

12.
对蛋白质相互作用的研究不仅能够理解生命的过程,也能为疾病治疗提供线索.通过对现有蛋白质相互作用预测计算方法的分析,将计算方法和生命科学相结合,在利用现有的知名生物数据库获得大量蛋白质相互作用关系数据的基础上,建立人类蛋白质相互作用网络,通过计算来预测可能导致帕金森病的蛋白质.在总结前人算法的基础上,利用改进的APM[1]算法,实现了对蛋白质一级网络以及二级网络的预测工作.  相似文献   

13.
蛋白质相互作用中界面残基的识别在药物设计与生物体的新陈代谢等方面有着广泛应用。基于朴素贝叶斯分类器对属性条件独立性的要求,构建了由蛋白质序列谱和溶剂可及表面积组成的蛋白质相互作用特征模型。在一个具有代表性的蛋白质异源复合物组成的数据集中取得了68.1%的准确率、0.201 的相关系数、40.2%的特异度和 49.9%的灵敏度,取得了比其他方法更优的结果,且远优于随机的实验结果。通过一个三维可视化的结果更好地验证了方法的有效性。  相似文献   

14.
研究蛋白质相互作用网络的演化机制及模型对于理解生物系统的进化及组织形成过程具有重要的意义。到目前为止,已经出现了多种依赖不同演化机制的蛋白质相互作用网络演化模型,这些模型有针对性地体现了真实蛋白质相互作用网络中出现的某些拓扑特征,但同时也具有一定的局限性。通过对典型蛋白质相互作用网络演化模型进行研究,从模型的构建机理、演化模型及真实蛋白质相互作用网络的拓扑特征等方面进行了分析和比较,并总结了各个模型的特点。最后,对蛋白质网络演化模型的进一步发展提出了自己的看法,为深入理解蛋白质相互作用网络演化模型提供有益参考。  相似文献   

15.
16.
Protein-protein interactions are a vital component in both the function and regulation of virtually all biological processes. In the yeast two-hybrid system, one of the most commonly-used methods for studying protein-protein interactions, protein-protein interactions are detected by expression of a reporter gene driven by the interaction between bait and prey proteins. We report here the development of an automated system, the MegaMate, for carrying out high throughput (over 100,000 clones per day) yeast two-hybrid screens with full data tracking.  相似文献   

17.
In this paper, we describe a machine learning approach for sequence-based prediction of protein-protein interaction sites. A support vector machine (SVM) classifier was trained to predict whether or not a surface residue is an interface residue (i.e., is located in the protein-protein interaction surface), based on the identity of the target residue and its ten sequence neighbors. Separate classifiers were trained on proteins from two categories of complexes, antibody-antigen and protease-inhibitor. The effectiveness of each classifier was evaluated using leave-one-out (jack-knife) cross-validation. Interface and non-interface residues were classified with relatively high sensitivity (82.3% and 78.5%) and specificity (81.0% and 77.6%) for proteins in the antigen-antibody and protease-inhibitor complexes, respectively. The correlation between predicted and actual labels was 0.430 and 0.462, indicating that the method performs substantially better than chance (zero correlation). Combined with recently developed methods for identification of surface residues from sequence information, this offers a promising approach to predict residues involved in protein-protein interactions from sequence information alone.  相似文献   

18.
探测蛋白质相互作用网络中的功能模块对于理解生物系统的组织和功能具有重要的意义。目前,普遍的做法是将蛋白质相互作用网络表示成一个图,利用各种图聚类算法来挖掘功能模块。本文采用了基于模块度优化的图聚类算法来探测蛋白质相互作用网络中的集团,从具有2617个节点11855个相互作用的酵母蛋白相互作用网络中探测出68个集团。对于得到的集团,首先从拓扑结构的角度验证其的确是内部连接稠密的子图,然后分析了MIPS数据库中ComplexCat提供的已知的蛋白质复合体与这些集团的重叠情况,发现很多蛋白质复合体完全包含在某些集团中,最后使用超几何聚集分布的P值来分析一个集团对某个特定功能的富集程度,并根据最小的P值对应的功能来注释该集团的主要功能,发现集团中大部分的蛋白质具有相同的功能。研究结果表明,该方法探测的集团具有重要的生物学功能意义。  相似文献   

19.
Protein complexes play important roles in integrating individual gene products to perform useful cellular functions.The increasing mount of protein–protein interaction(PPI)data has enabled us to predict protein complexes.In spite of the advances in these computational approaches and experimental techniques,it is impossible to construct an absolutely reliable PPI network.Taking into account the reliability of interactions in the PPI network,we have constructed a weighted protein–protein interaction(WPPI)network,in which the reliability of each interaction is represented as a weight using the topology of the PPI network.As overlaps are likely to have biological importance,we proposed a novel method named WN-PC(weighted network-based method for predicting protein complexes)to predict overlapping protein complexes on the WPPI network.The proposed algorithm predicts neighborhood graphs with an aggregation coefficient over a threshold as candidate complexes,and binds attachment proteins to candidate complexes.Finally,we have filtered redundant complexes which overlap other complexes to a very high extent in comparison to their density and size.A comprehensive comparison between competitive algorithms and our WN-PC method has been made in terms of the F-measure,coverage rate,and P-value.We have applied WN-PC to two different yeast PPI data sets,one of which is a huge PPI network consisting of over 6000 proteins and 200000 interactions.Experimental results show that WN-PC outperforms the state-of-the-art methods.We think that our research may be helpful for other applications in PPI networks.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号