首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 531 毫秒
1.
针对在蛋白质相互作用网络上的关键蛋白质识别只关注拓扑特性,蛋白质相互作用数据中存在较高比例的假阳性数据以及基于复合物信息的关键蛋白质识别算法对节点的邻域信息和复合物的挖掘对关键蛋白质的识别影响效果考虑不够全面等导致的识别准确率和特异性不高的问题,提出一种基于复合物参与度和密度的关键蛋白质预测算法PEC。首先融合GO注释信息和边聚集系数构造加权PPI网络,克服假阳性对实验结果的影响;基于蛋白质相互作用的边权重,构造相似度矩阵,设计特征值间的最大本征差值来自动确定划分数目K,同时根据加权网络中的蛋白质节点度来选取K个初始聚类中心,进而利用谱聚类结合模糊C-means聚类算法实现复合物的挖掘,提高聚类的准确率,降低数据的维数;其次基于蛋白质节点的复合物参与度以及节点邻域子图密度,设计出关键节点的关键性得分。在DIP和Krogan 2个数据集上,将PEC与DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10种经典算法相比,实验结果表明,PEC算法能够识别出更多的关键蛋白质,且聚类结果的准确率和特异性较高。  相似文献   

2.
洪海燕  刘维 《计算机科学》2017,44(10):38-44
关键蛋白质是生物体内维持所有生命活动最重要的物质基础。随着高通量技术的发展,如何从蛋白质相互作用网络中识别出关键蛋白质成为目前蛋白质组学的研究热点。针对大部分现有方法仅仅基于网络拓扑结构信息进行识别以及蛋白质相互作用数据假阳性高的问题,提出了改进的粒子群算法来识别关键蛋白质。通过综合考虑网络拓扑结构特性和多源生物属性信息构建了高质量的加权网络,还考虑使用蛋白质节点间联系的紧密程度来衡量蛋白质的关键性,并扩展局部网络拓扑至二阶邻居,大大提高了预测的准确率。提出了衡量top-p关键蛋白质的整体性指标,降低了计算复杂度。在标准数据集上的实验结果表明,与其他经典算法相比,所提算法更具优势,能够识别出更多的蛋白质,具有较高的准确率。  相似文献   

3.
关键蛋白质是有机体生存不可或缺的蛋白质.关键蛋白质的识别有助于理解细胞生命的最低要求、发现致病基因和药物靶点,对疾病的诊治和药物设计等有重要意义.现有方法表明整合蛋白质互作网络和序列的相关特征可以提高对关键蛋白质的识别精度和鲁棒性.文中整合了基因表达谱、蛋白质互作网络和亚细胞位置信息,设计了一种混合神经网络模型IEPHDL.该模型首次使用双向门控循环单元对基因表达谱进行特征学习,使用由多个全连接层组成的深度神经网络对3种数据特征进行深度再学习,充分发挥双向门控循环单元网络、全连接网络、Node2vec在特征学习和表示方面的优势,实现对关键蛋白质的有效识别.实验表明,IEPHDL对关键蛋白质识别的准确率为88.7%,精确率为86.2%,AUC为85.2%,其准确率比当前最优的中心性方法、机器学习方法、深度学习方法依次高出13%,8.9%,3.8%,其他指标也均高于这三者.最后,通过实验分析,证实了双向门控循环单元网络依赖自身强大的特征学习能力,在关键蛋白质识别中起着关键作用.  相似文献   

4.
关键蛋白质作为蛋白质中的关键物质,不仅对研究细胞生长调控有着重要意义,也为更深层次的疾病研究奠定理论基础.目前,针对关键蛋白质的识别方法大多为应用基因表达信息和蛋白质相互作用网络,提出识别关键蛋白质的静态和动态网络方法,但这些方法未考虑基因表达调控的周期性规律,无法准确地刻画受基因周期调控的蛋白质网络.为此,在基因表达动态性的基础上引入了基因周期性表达的概念,提出了一种动态网络切分方法.该方法通过构建基因“活性”表达矩阵,利用切分后的“活性”表达矩阵作用于蛋白质相互作用网络,从而形成蛋白质周期子网络,最终综合各周期子网络来衡量蛋白质结点在网络中的重要性.实验结果表明,该方法在酵母、大肠杆菌和人类膀胱数据中可以有效地提高关键蛋白质预测率.  相似文献   

5.
关键蛋白质的识别对于理解细胞的生长调控过程、疾病研究和药物设计等方面具有重要的意义。随着高通量技术的发展,越来越多的蛋白质相互作用数据被获取,使得可以从网络水平上研究关键蛋白质。目前,许多基于蛋白质网络拓扑特征的算法被提出,但是这类方法忽略了蛋白质网络的生物信息和假阴性、假阳性数据的影响。因此,论文通过结合蛋白质结构域和蛋白质网络的拓扑特征提出了一种新的算法Do-ECC。实验结果表明,Do-ECC明显优于其他8种算法(D C,BC,CC,SC,EC,IC,LAC,NC)。  相似文献   

6.
关键蛋白质是生物体内一切生命活动中不可缺少的物质基础,关键蛋白质的识别不仅可以从理论上理解生命活动机理,同时在实际应用中为药物研制、疾病治疗提供重要基础。目前,现有的关键蛋白质识别算法大多应用在静态PPI网络上,忽略了蛋白质的动态性和保守性,只考虑网络拓扑结构,忽略了蛋白质的生物特性,并且未能完全解决PPI网络中假阳性和假阴性问题。针对以上问题,构建一种混合动态保守蛋白质的时序加权PPI网络,并提出一种名为JTBC(Joint Topological properties,Biological properties and Complexes information)的关键蛋白质识别算法。利用基因表达数据提取动态蛋白质和保守蛋白质的活性信息,以动态调整静态PPI网络进而构建时序PPI网络,有效降低了PPI网络中的假阴性;设计一种融合双重拓扑特性的点边凝聚度DEcc(node and edge cohesion coefficient),以衡量蛋白质在PPI网络中的拓扑特性,再结合带有生物特性的蛋白质结构域信息和皮尔逊相关系数为时序PPI网络加权,以准确描述蛋白质之间的相互作用,减少了假阳性的影响;根据关键蛋白质的聚集特性和共表达特性,设计一种共表达复合物中心性方法局部评估蛋白质的重要程度。综上考虑,整合权重信息和蛋白质复合物信息来综合衡量蛋白质的关键性。实验结果表明该算法能够从全局和局部特性较准确地识别关键蛋白质。  相似文献   

7.
蛋白质相互作用网络(Protein-Protein Interactions Network,PIN)的相似性问题是目前生物信息学领域研究的热点。将计算机科学和生物学相结合,提出了蛋白质相互作用网络邻居优先搜索算法。该算法综合蛋白质的序列信息和蛋白质相互作用网络的拓扑结构信息,适度提高与相似蛋白质有直接相互作用的蛋白质之间的相似系数,实现了不同物种间蛋白质相互作用相似子网络的搜索。与同类算法的对比实验表明,该算法可以处理更大规模的目标子网搜索,计算速度明显提高,且利用该算法获得的结果与目标子网具有更长的相似路径。论文采用该算法研究了酵母和果蝇的蛋白质相互作用网络,获得了10条相对保守的蛋白质相互作用(Protein-Protein Interactions,PPI)。  相似文献   

8.
蛋白质亚细胞定位是蛋白质组学基本问题之一。某些类型蛋白质可能存在于两个或两个以上的亚细胞位置,这类蛋白质的亚细胞定位问题更为复杂。分别利用Gene Ontology和伪氨基酸成分法,将一条蛋白质表示为一实值向量;采纳多标记学习中的Ranking思想,计算出一得分向量V,该向量的每一分量的值表示被预测蛋白质属于某个亚细胞位置的概率;利用最近邻算法预测蛋白质所属亚细胞位置的个数n,得分向量V中得分最高的n个分量对应的亚细胞位置即为预测的位置。  相似文献   

9.
洪海燕  刘维 《计算机科学》2016,43(Z11):16-20, 25
关键蛋白质对于细胞生活是不可缺少的,识别关键蛋白质可以帮助了解细胞生活的最小需求,同时对药物设计也有非常大的作用。随着高通量技术的发展,人们可得到越来越多的蛋白质-蛋白质相互作用(PPI)的数据,这就使得可以在网络层次上来研究关键蛋白质。目前,学术界已经提出了一系列的计算方法来识别关键蛋白质,但这些方法并没有完全解决蛋白质相互作用数据的假阳性问题。除此之外,现有方法一般只考虑了网络的拓扑结构,对于生物信息的考虑,目前还是比较欠缺的。蛋白质对于人类细胞的生命活动不仅仅与网络拓扑结构有关,还和蛋白质在网络上的生物信息相关。因此,针对以上问题,提出了一种高效的预测关键蛋白质的新方法EPP(Essential Proteins Predict),该方法通过计算蛋白质在PPI网络中的重要性来进行预测,蛋白质的重要性越高,成为关键蛋白质的可能性就越大。取重要性排名前P%的蛋白质作为关键蛋白质,在进行蛋白质重要性的计算时,综合考虑语义相似度及可信度因素,以综合考虑网络的拓扑结构与蛋白质本身的生物信息。实验结果表明,与其他传统方法相比,提出的新方法复杂度较低,且能够识别出更多的关键蛋白质,并且其统计指标也高于其他的方法。  相似文献   

10.
针对传统机器学习算法中仍需手工操作表示特征的问题,提出了一种基于堆栈式降噪自编码器(SDAE)深度网络的蛋白质亚细胞定位算法。首先,分别利用改进型伪氨基酸组成法(PseAAC)、伪位置特异性得分矩阵法(PsePSSM)和三联体编码法(CT)对蛋白质序列进行特征提取,并将这三种方法得到的特征向量进行融合,以得到一个全新的蛋白质序列特征表达模型;接着,将融合后的特征向量输入到SDAE深度网络里自动学习更有效的特征表示;然后选用Softmax回归分类器进行亚细胞的分类预测,并采用留一法在Viral proteins和Plant proteins两个数据集上进行交叉验证;最后,将所提算法的结果与mGOASVM、HybridGO-Loc等多种现有算法的结果进行比较。实验结果表明,所提算法在Viral proteins数据集上取得了98.24%的准确率,与mGOASVM算法相比提高了9.35个百分点;同时所提算法在Plant proteins数据集上取得了97.63%的准确率,比mGOASVM算法和HybridGO-Loc算法分别提高了10.21个百分点和4.07个百分点。综上说明所提算法可以有效提高蛋白质亚细胞定位预测的准确性。  相似文献   

11.
针对传统机器学习算法中仍需手工操作表示特征的问题,提出了一种基于堆栈式降噪自编码器(SDAE)深度网络的蛋白质亚细胞定位算法。首先,分别利用改进型伪氨基酸组成法(PseAAC)、伪位置特异性得分矩阵法(PsePSSM)和三联体编码法(CT)对蛋白质序列进行特征提取,并将这三种方法得到的特征向量进行融合,以得到一个全新的蛋白质序列特征表达模型;接着,将融合后的特征向量输入到SDAE深度网络里自动学习更有效的特征表示;然后选用Softmax回归分类器进行亚细胞的分类预测,并采用留一法在Viral proteins和Plant proteins两个数据集上进行交叉验证;最后,将所提算法的结果与mGOASVM、HybridGO-Loc等多种现有算法的结果进行比较。实验结果表明,所提算法在Viral proteins数据集上取得了98.24%的准确率,与mGOASVM算法相比提高了9.35个百分点;同时所提算法在Plant proteins数据集上取得了97.63%的准确率,比mGOASVM算法和HybridGO-Loc算法分别提高了10.21个百分点和4.07个百分点。综上说明所提算法可以有效提高蛋白质亚细胞定位预测的准确性。  相似文献   

12.
蛋白质亚细胞的定位预测不仅是研究蛋白质结构和功能的重要基础,还对了解某些疾病的发病机理、药物设计与发现具有重要意义。然而,如何利用机器学习精准预测蛋白质亚细胞的位置一直是一项具有挑战性的科学难题。针对这一问题,提出了一种基于聚类与特征融合的蛋白质亚细胞定位方法。首先将自相关系数法和熵密度法引入蛋白质特征表达模型的构建,并在传统的PseAAC(Pseudo-amino Acid Composition)的基础上提出了一种改进型PseAAC方法。为了更好地表达蛋白质序列信息,文中首先将自相关系数法、熵密度法和改进型PseAAC进行融合,构造了一种全新的蛋白质序列表征模型;然后利用主成分分析法对融合后的特征向量进行降维,将结果输入到LibD3C集成分类器,对蛋白质亚细胞进行分类预测,并采用留一法在Gram-positive和Gram-negative数据集上进行交叉检验;最后将取得的实验结果与其他现有算法进行比较。实验结果表明,所提方法在Gram-positive和Gram-negative数据集上分别取得了99.24%和95.33%的预测准确率,说明所提方法具有科学性和有效性。  相似文献   

13.
基于改进的RSSI无线传感器网络节点定位算法研究   总被引:2,自引:0,他引:2  
研究无线传感器网络节点定位问题。接收信号强度值(RSSI)直接影响无线传感器网络节点定位准确度,而现有定位算法没有考虑锚节点的RSSI消息,造成节点定位精度低。为了提高无线传感器网络节点的定位精度,提出了一种基于RSSI的质心定位算法。首先通过无线信号强度计算出节点间RSSI值,然后把RSSI值转换成质心算法权值,最后采用质心定位算法对待测节点位置进行估计,获得节点的准确位置。仿真实验结果表明,与现有质心定位算法相比,基于RSSI的质心定位算法在不增加成本、通信功耗的情况下,提高了节点定位精度,降低了定位误差,适合各种规模的无线传感器网络的节点定位。  相似文献   

14.
15.
目的 人脸关键点检测和人脸表情识别两个任务紧密相关。已有对两者结合的工作均是两个任务的直接耦合,忽略了其内在联系。针对这一问题,提出了一个多任务的深度框架,借助关键点特征识别人脸表情。方法 参考inception结构设计了一个深度网络,同时检测关键点并且识别人脸表情,网络在两个任务的监督下,更加关注关键点附近的信息,使得五官周围的特征获得较大响应值。为进一步减小人脸其他区域的噪声对表情识别的影响,利用检测到的关键点生成一张位置注意图,进一步增加五官周围特征的权重,减小人脸边缘区域的特征响应值。复杂表情引起人脸部分区域的形变,增加了关键点检测的难度,为缓解这一问题,引入了中间监督层,在第1级检测关键点的网络中增加较小权重的表情识别任务,一方面,提高复杂表情样本的关键点检测结果,另一方面,使得网络提取更多表情相关的特征。结果 在3个公开数据集:CK+(Cohn-Kanade dataset),Oulu(Oulu-CASIA NIR&VIS facial expression database)和MMI(MMI facial expression database)上与经典方法进行比较,本文方法在CK+数据集上的识别准确率取得了最高值,在Oulu和MMI数据集上的识别准确率比目前识别率最高的方法分别提升了0.14%和0.54%。结论 实验结果表明了引入关键点信息的有效性:多任务的卷积神经网络表情识别准确率高于单任务的传统卷积神经网络。同时,引入注意力模型也提升了多任务网络中表情的识别率。  相似文献   

16.
In many network applications such as surveillance systems, it is crucial to detect the target and estimate its location. Distributed processing algorithms are capable of providing fast, secure, scalable and robust solutions. In this paper, we study the problem of target detection and localization in a wireless sensor network. Most of the current researches have focused on centralized algorithms and the works done on distributed algorithms usually need center assistance and practical issues such as communication link failure is not addressed in them. In this paper, we first propose a distributed consensus-based algorithm for target detection and then propose a distributed consensus-based localization algorithm. We assume that the target transmits a radio signal that is received in sensors equipped with limited computational and power resources. We consider the communication link failure and use the collaboration of sensor nodes to detect the presence of target. In the proposed target localization algorithm, sensor nodes estimate their distance toward the target using the received signal strength. In both the proposed algorithms, sensor nodes exchange information only with their neighbors and each makes an individual decision. We further prove the convergence of the proposed algorithms. Computer simulations confirm that the proposed algorithms are very fast and applicable in high-performance networks. We improve the localization accuracy at least by 25 % in terms of localization error compared with some recent algorithms.  相似文献   

17.
In several wireless sensor network applications the availability of accurate nodes' location information is essential to make collected data meaningful. In this context, estimating the positions of all unknown-located nodes of the network based on noisy distance-related measurements (usually referred to as localization) generally embodies a non-convex optimization problem, which is further exacerbated by the fact that the network may not be uniquely localizable, especially when its connectivity degree is not sufficiently high. In order to efficiently tackle this problem, we propose a novel two-objective localization approach based on the combination of the harmony search (HS) algorithm and a local search procedure. Moreover, some connectivity-based geometrical constraints are defined and exploited to limit the areas in which sensor nodes can be located. The proposed method is tested with different network configurations and compared, in terms of normalized localization error and three multi-objective quality indicators, with a state-of-the-art metaheuristic localization scheme based on the Pareto archived evolution strategy (PAES). The results show that the proposed approach achieves considerable accuracies and, in the majority of the scenarios, outperforms PAES.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号