首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
蛋白质相互作用(Protein-protein interaction,PPI)网络是生命活动中一种极其重要的生物分子关系网络,利用计算方法从PPI网络中检测功能模块是目前生物信息学中一项重要的研究课题. 本文首先总结了功能模块检测过程的基本流程,说明了预处理和后处理的作用;其次,提出了一种模块检测方法的分类体系,并对其中一些代表性的检测算法进行了阐述;再次,给出了模块检测常用的数据库、评价指标和相关软件工具,并通过实验对代表性算法进行了性能对比. 最后,通过对该领域挑战性问题的分析预测了模块检测未来的研究方向,以期对相关研究提供一定的参考.  相似文献   

2.
针对谱聚类融合模糊C-means(FCM)聚类的蛋白质相互作用(PPI)网络功能模块挖掘方法准确率不高、执行效率较低和易受假阳性影响的问题,提出一种基于模糊谱聚类的不确定PPI网络功能模块挖掘(FSC-FM)方法。首先,构建一个不确定PPI网络模型,使用边聚集系数给每一条蛋白质交互作用赋予一个存在概率测度,克服假阳性对实验结果的影响;第二,利用基于边聚集系数流行距离(FEC)策略改进谱聚类中的相似度计算,解决谱聚类算法对尺度参数敏感的问题,进而利用谱聚类算法对不确定PPI网络数据进行预处理,降低数据的维数,提高聚类的准确率;第三,设计基于密度的概率中心选取策略(DPCS)解决模糊C-means算法对初始聚类中心和聚类数目敏感的问题,并对预处理后的PPI数据进行FCM聚类,提高聚类的执行效率以及灵敏度;最后,采用改进的边期望稠密度(EED)对挖掘出的蛋白质功能模块进行过滤。在酵母菌DIP数据集上运行各个算法可知,FSC-FM与基于不确定图模型的检测蛋白质复合物(DCU)算法相比,F-measure值提高了27.92%,执行效率提高了27.92%;与在动态蛋白质相互作用网络中识别复合物的方法(CDUN)、演化算法(EA)、医学基因或蛋白质预测算法(MGPPA)相比也有更高的F-measure值和执行效率。实验结果表明,在不确定PPI网络中,FSC-FM适合用于功能模块的挖掘。  相似文献   

3.
蛋白质网络中复合体和功能模块预测算法研究   总被引:4,自引:0,他引:4  
鱼亮  高琳  孙鹏岗 《计算机学报》2011,34(7):1239-1251
预测蛋白质相互作用网络中的复合体和功能模块对于理解生物系统的组织和功能具有重要的意义.到目前为止,已经出现了大量的蛋白质复合体和功能模块预测算法及相关的软件,这些算法各具特色,但同时也具有一定的局限.文中对典型的聚类预测算法进行了研究,依据算法特性对它们进行了分类,并从算法思想、关键技术以及算法性能等方面进行了分析和比...  相似文献   

4.
随着可获得的大规模蛋白质相互作用数据的迅速增长,从系统水平上对细胞机制的基本组件和结构的理解成为了一种可能。如今所面临的最大挑战是如何通过分析此类复杂的相互作用数据来反映细胞组织、进程以及功能的规律。基于图理论的聚类方法是分析蛋白质相互作用数据的有效手段。本文将从蛋白质相互作用网络(PPI网络)的图模型、聚类算法、评估方法及应用几个方面描述PPI网络聚类分析的最新研究进展。最后,讨论该方向研究所面临的挑战及进一步的研究方向。  相似文献   

5.
依据人类AD(Alzheimer’s Disease)相关蛋白质相互作用网络图,利用基于算术平均最小值——AAMV(Arithmetic Average Minimum Value)的K-means聚类方法对蛋白质进行聚类并预测4个孤立蛋白质的功能。分析结果表明:所得结果与用Maryland Bridge 法及Korbel法所得结果非常相似。  相似文献   

6.
认定蛋白质交互网中的功能模块对于理解细胞的组织结构,处理过程及其功能都是至关重要的。由于一个蛋白质可能具有多重功能因此蛋白质功能模块可能会相互交叠。然而,目前已有的一些识别功能模块的软聚类算法有如下两个缺陷:一是一些算法需要阈值来截断聚类;二是有些算法需要预设聚类数目。为了克服这两个缺陷,提出了随机走步软聚类识别算法来认定蛋白质交互网中的交叠功能模块。实验结果表明该算法在无需任何参数的情况下能发现一些重要的交叠功能模块。  相似文献   

7.
蛋白质互作用(protein-protein interaction, PPI)网络是广泛存在的一类复杂生物网络,其网络拓扑特征与功能模块分析密切相关.图聚类是对复杂网络进行分析和处理的一种重要计算方法.传统的PPI网络中蛋白质复合体检测算法通常对网络图中的对象进行硬划分,而寻找网络中的重叠簇的软聚类算法已成为当前研究热点之一.现有的软聚类算法较少关注寻找网络中具有重要生物意义的小规模非稠密簇.对此,基于网络中结点邻域给出了边关联强度的度量方法,并在此基础上提出了一种基于流模拟的PPI网络中复合体检测的图聚类(flow-simulation graph clustering, F-GCL)算法,该算法可以在快速发现PPI网络中的重叠簇的同时找到小规模非稠密簇;同时,与MCODE(molecular complex detection),MCL(Markov clustering),RNSC(restricted neighborhood search clustering)和CPM(clique percolation method)算法在6个酿酒酵母PPI网络上进行比较,该算法在F-measure,Accuracy,Separation方面表现了较好的性能.  相似文献   

8.
蛋白质相互作用网络的蜂群信息流聚类模型与算法   总被引:1,自引:0,他引:1  
蛋白质相互作用网络的聚类算法研究是充分理解分子的结构、功能及识别蛋白质的功能模块的重要方法.很多传统聚类算法对于蛋白质相互作用网络聚类效果不佳.功能流模拟算法是一种新型聚类算法,但该算法没有考虑到距离的作用效果并且需要人为地设置合并阈值,带有主观性.文中提出了一种新颖的基于蜂群优化机理的信息流聚类模型与算法.该方法中,数据预处理采用结点网络综合特征值的排序来初始化聚类中心,将蜂群算法的蜜源位置对应于其聚类中心,蜜源的收益度大小对应于模块间的相似度,采蜜蜂结点的所有邻接点按照结点网络综合特征值的降序排列,作为侦察蜂的搜索邻域.采用正确率、查全率等指标对聚类效果做出客观评价,并对算法的一些关键参数进行仿真、对比与分析.结果表明新算法不仅克服了原功能流模拟算法的缺点,且其正确率和查全率的几何平均值最高,能够有效地识别蛋白质功能模块.  相似文献   

9.
田盼盼  陈璟 《计算机工程》2022,48(2):65-71+78
生物网络比对是研究生物进化过程的重要手段,不同物种间的比对不仅有助于理解物种的知识转移,同时也有助于进行功能预测和检测保守功能成分。然而,现有比对算法很难实现拓扑度量和生物度量同时最优。设计JAlign算法,将拓扑相似性与归一化序列相似性相结合构成目标函数,基于种子-扩展算法和模块检测进行全局比对。在种子筛选阶段,利用Jerarca聚类算法划分功能模块,借助目标函数计算模块间的相似性进行最优模块匹配,并从匹配结果中提取部分节点对作为种子节点。在扩展阶段,将比对从种子节点扩展至其邻居节点,在选择节点对进行扩展比对时综合考虑节点之间的连接关系、度差值、节点相似性等因素。在此基础上,为避免遗漏分散节点,找到剩余未匹配的节点构建二分图,以贪心方式进行最大加权二分图匹配,并将匹配结果合并到比对集合中,完成最终匹配。实验结果表明,JAlign算法能够实现拓扑度量和生物度量的良好平衡,其边正确性指标、诱导保守子结构得分、对称子结构得分和生物质量使用功能一致性指标均优于L-GRAAL、SPINAL和ModuleAlign算法,在时间效率上也具有优势。  相似文献   

10.
基于关键功能模块挖掘的蛋白质功能预测   总被引:1,自引:0,他引:1  
精确注释蛋白质功能是从分子水平理解生物体的关键.由于内在的困难和昂贵的开销,实验方法注释蛋白质功能已经很难满足日益增长的序列数据.为此,提出了许多基于蛋白质相互作用(Protein-protein interaction,PPI)网络的计算方法预测蛋白质功能.当今蛋白质功能预测的趋势是融合蛋白质相互作用网络和异构生物数据.本文提出一种基于多关系网络中关键功能模块挖掘的蛋白质功能预测算法.关键功能模块由一组紧密联系且共享生物功能的蛋白质组成,它们能与网络中的剩余部分较好地区分开来.算法通过从多关系网络的每一个简单网络中挖掘高内聚、低耦合的子图形成关键功能模块.关键功能模块中邻居蛋白质的功能用于注释待预测功能的蛋白质.每一个简单网络在蛋白质功能预测中的重要性各不相同.实验结果表明,提出的方法性能优于现有的蛋白质功能预测方法.  相似文献   

11.
鉴于多标签传播算法在发现社会网络的社区结构研究上具有快速、高效的求解能力,提出融合多源蛋白质生物学知识的基于多标签传播机制的蛋白质相互作用(PPI)网络功能模块检测算法.首先,结合PPI网络功能信息和结构信息初始化节点的标签.然后,利用基因表达数据描述蛋白质间的共表达性,依据共表达性构建标签集合,从中选择标签以实现标签在节点间真实可靠的传播.最后,将具有相同标识符的节点划分到同一功能模块中,获得最终结果.实验表明文中算法不仅具有良好的时间性能,而且在检测精度上也具有一定的竞争性.  相似文献   

12.
蛋白质组学的快速发展,特别是高通量技术的发展产生了大量的蛋白质相互作用数据,为人们从更深层次理解蛋白质之间的相互作用及其在复杂疾病的作用机理提供了基础.一个生物体内所有的蛋白质与蛋白质之间的相互作用组成的网络称为蛋白质网络.传统的研究多是基于静态的蛋白质网络模型.然而,由于蛋白质自身表达的动态性及蛋白质间相互作用的动态性,真实的蛋白质网络会随着时间和条件不断变化,与疾病的发生和发展有关的蛋白质功能模块也与这种动态变化密切相关.因此,研究者已经把注意力从关注蛋白质网络的静态属性转移到动态属性上,提出了一系列的动态蛋白质网络的构建方法.在介绍静态蛋白质网络的基础上,分类讨论了动态蛋白质网络的构建方法,将现有的动态蛋白质网络的构建方法归纳为基于蛋白质表达动态性的方法、基于多状态下表达及相关性变化的方法和基于时空动态变化的方法这3类:第1类体现的是蛋白质自身表达随时间演化的动态性,第2类则表现为不同条件下蛋白质之间表达相关性的改变,第3类则体现了蛋白质及蛋白质相互作用在时间和空间上的动态变化.然后,对动态蛋白质网络的蛋白质节点和相关子网络进行了动态分析并详细介绍了动态蛋白质网络在复杂疾病中的一些主流应用,如蛋白质复合物识别、蛋白质功能预测、生物标志物识别、疾病基因预测等.最后,对动态蛋白质网络所面临的挑战与未来的研究方向进行了探讨.  相似文献   

13.
Proteins usually bind together to form complexes, which play an important role in cellular activities. Many graph clustering methods have been proposed to identify protein complexes by finding dense regions in protein-protein interaction networks. We present a novel framework (CPL) that detects protein complexes by propagating labels through interactions in a network, in which labels denote complex identifiers. With proper propagation in CPL, proteins in the same complex will be assigned with the same labels. CPL does not make any strong assumptions about the topological structures of the complexes, as in previous methods. Tile CPL algorithm is tested on several publicly available yeast protein-protein interaction networks and compared with several state-of-the-art methods. The results suggest that CPL performs better than the existing methods. An analysis of the functional homogeneity based on a gene ontology analysis shows that the detected complexes of CPL are highly biologically relevant.  相似文献   

14.
蛋白质关系抽取研究对于生命科学各领域的研究具有广泛的应用价值。但是,基于机器学习的蛋白质关系抽取方法普遍停留在二元关系抽取,失去了丰富的关系类型信息,而基于规则的开放式信息抽取方法可以抽取完整的蛋白质关系(“蛋白质1,关系词,蛋白质2”),但是召回率较低。针对以上问题,该文提出了一种混合机器学习和规则方法的蛋白质关系抽取框架。该框架先利用机器学习方法完成命名实体识别和二元关系抽取,然后利用基于句法模板和词典匹配的方法抽取表示当前两个蛋白质间关系类型的关系词。该方法在AImed语料上取得了40.18%的F值,远高于基于规则的Stanford Open IE方法。  相似文献   

15.
随着分子生物学的研究进入以蛋白质组学为标志的后基因组时代,蛋白质相互作用成为蛋白质组学研究的一个重要主题.因为计算方法代价低和周期短的特点,它被广泛地用来分析相互作用数据从而指导生物学家的实验设计.从蛋白质相互作用网络的构建到分析两个方面综述了蛋白质相互作用研究中的各种计算方法:介绍了通过机器学习方法预测、文本挖掘和评估相互作用的各种技术;特别详细地阐述了相互作用网络的重要参数和典型生物模型,并对运用图论方法分析和计算的各种算法进行了深入的剖析;最后,对蛋白质相互作用的计算研究进行了总结和展望.  相似文献   

16.
蛋白质的功能常体现在生物大分子的相互作用中,识别蛋白质相互作用位点对于研究蛋白质功能发挥着重要作用。蛋白质间主要通过表面残基发生相互作用,蛋白质相互作用形成复合体时,只有部分表面残基参与了该过程。基于序列谱信息,提取序列上相邻残基的序列谱作为输入特征向量,对大小为3和7的残基信息窗(win3,win7),分别采用支持向量机(SVM)分类器对蛋白质相互作用位点进行预测、比较和分析。最终实验结果为:win3的平均正确率为69.31%,win7的平均正确率为69.68%。  相似文献   

17.
针对加权模块度函数聚类算法在蛋白质相互作用网络中进行复合物识别的准确率不高、召回率较低以及时间性能不佳等问题进行了研究,提出一种基于模块度函数的加权蛋白质复合物识别算法IWPC-MF(Algorithm for Identifying Weighted Protein Complexes based on Modularity Function)。融合点聚集系数改进边聚集系数,将改进后的边点聚集系数与基因共表达的皮尔逊相关系数结合来构建加权蛋白质网络;基于节点权重选取种子节点,遍历种子的邻居节点,设计节点间的相似度度量和蛋白质附着度来获取初始聚类模块;设计基于紧密度的蛋白质复合物模块度函数来合并初始模块,并最终完成复合物的识别,克服传统的模块度函数无法识别出重叠和规模较小的复合物的缺陷。将IWPC-MF算法应用在DIP数据上进行复合物的识别,实验结果表明IWPC-MF算法的准确率和召回率较高,能够较准确地识别蛋白质复合物。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号