首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 158 毫秒
1.
蛋白质亚细胞定位预测对于确定蛋白质功能、揭示分子交互机理、理解复杂生理过程和设计药物靶标等方面都有很大的促进作用。随着后基因组时代中蛋白质序列数据的指数增长, 研究基于机器学习的计算性蛋白质亚细胞定位预测方法变得越来越重要。为了能够把握该问题的研究状况, 从数据集构建、蛋白质特征提取与表示、预测算法设计、算法测试和Web服务的建立等五个方面对蛋白质亚细胞定位预测的研究进行了综述。指出了目前该研究领域需要解决的核心问题及难点问题, 分析了当前研究中出现的一些新情况, 并对将来的研究方向和研究重点进行了展望。  相似文献   

2.
蛋白质亚细胞位置预测研究是目前蛋白质组学和生物信息学研究的重点问题之一。蛋白质的亚细胞定位决定了它的生物学功能,故研究亚细胞定位对了解蛋白质功能非常重要。由于蛋白质结构的序列性,考虑使用序列模型来进行亚细胞定位研究。尝试使用卷积神经网络(convolutional neural network,CNN)、长短期记忆神经网络(long short-term memory,LSTM)两种模型挖掘氨基酸序列所包含的信息,从而进行亚细胞定位的预测。随后构建了基于卷积的长短期记忆网络(Convolutional-LSTM)的集成模型进行亚细胞定位。首先通过卷积神经网络对蛋白质数据进行特征抽取,随后进行特征组合,并将其送入长短期记忆神经网络进行特征表征学习,得到亚细胞定位结果。使用该模型能达到0.816 5的分类准确率,比传统方法有明显提升。  相似文献   

3.
蛋白质亚细胞的定位预测不仅是研究蛋白质结构和功能的重要基础,还对了解某些疾病的发病机理、药物设计与发现具有重要意义。然而,如何利用机器学习精准预测蛋白质亚细胞的位置一直是一项具有挑战性的科学难题。针对这一问题,提出了一种基于聚类与特征融合的蛋白质亚细胞定位方法。首先将自相关系数法和熵密度法引入蛋白质特征表达模型的构建,并在传统的PseAAC(Pseudo-amino Acid Composition)的基础上提出了一种改进型PseAAC方法。为了更好地表达蛋白质序列信息,文中首先将自相关系数法、熵密度法和改进型PseAAC进行融合,构造了一种全新的蛋白质序列表征模型;然后利用主成分分析法对融合后的特征向量进行降维,将结果输入到LibD3C集成分类器,对蛋白质亚细胞进行分类预测,并采用留一法在Gram-positive和Gram-negative数据集上进行交叉检验;最后将取得的实验结果与其他现有算法进行比较。实验结果表明,所提方法在Gram-positive和Gram-negative数据集上分别取得了99.24%和95.33%的预测准确率,说明所提方法具有科学性和有效性。  相似文献   

4.
凋谢蛋白亚细胞定位预测是研究凋谢蛋白生物功能的 1 种重要的方法,也是生物信息学研究的重要领域之一.提高凋谢蛋白亚细胞定位预测模型准确性和实用性是该研究的重点.在本研究中,提出了以模糊 K 近邻分类算法作为基础分类器的集成分类算法.以蛋白质序列内不同间隔的二肽组成表示基本的蛋白质序列的特征集合,采用二进制粒子群算法作为特征选择方法提取能够有效的蛋白质序列特征.这些经过特征选择后的蛋白质序列特征作为集成分类算法中每一个基础分类器的输入向量.经过在2个常用的数据集上使用 Jackknife 测试,本文算法在 C1317 数据集上取得了 91.5% 的预测准确率,在ZW225数据集上取得了88.0%的准确率.与前人报道的算法预测结果比较,本文方法取得了较好的准确率.与使用相同数据集的已经报道凋谢蛋白亚细胞定位预测算法相比,本研究方法取得了预测准确率.  相似文献   

5.
乔善平  闫宝强 《计算机应用》2016,36(8):2150-2156
针对多标记学习和集成学习在解决蛋白质多亚细胞定位预测问题上应用还不成熟的状况,研究基于集成多标记学习的蛋白质多亚细胞定位预测方法。首先,从多标记学习和集成学习相结合的角度提出了一种三层的集成多标记学习系统框架结构,该框架将学习算法和分类器进行了层次性分类,并把二分类学习、多分类学习、多标记学习和集成学习进行有效整合,形成一个通用型的三层集成多标记学习模型;其次,基于面向对象技术和统一建模语言(UML)对系统模型进行了设计,使系统具备良好的可扩展性,通过扩展手段增强系统的功能和提高系统的性能;最后,使用Java编程技术对模型进行扩展,实现了一个学习系统软件,并成功应用于蛋白质多亚细胞定位预测问题上。通过在革兰氏阳性细菌数据集上进行测试,验证了系统功能的可操作性和较好的预测性能,该系统可以作为解决蛋白质多亚细胞定位预测问题的一个有效工具。  相似文献   

6.
获取凋亡蛋白亚细胞定位的信息对揭示细胞程序性死亡的机制和注解蛋白质功能都具有非常重要的意义。鉴于实验方法确定亚细胞定位不仅费时费力而且代价过高,开发快速有效的计算方法预测亚细胞定位已成为生物信息学领域的重要研究内容之一。首先基于位置特异性得分矩阵提取氨基酸组分、二肽组分和自协方差变量等特征构建蛋白质序列的特征表示模型,然后采用递归特征消除法进行特征选择,最后选用支持向量机分类器在两个常用数据集上进行夹克刀检验。实验结果表明,该方法优于大多数已报道的预测方法,从而证明了其有效性。  相似文献   

7.
使用伪氨基酸和集成分类器预测凋谢蛋白亚细胞定位   总被引:1,自引:1,他引:0  
预测凋谢蛋白质亚细胞定位是生物信息学和蛋白质科学中重要的研究内容.基于Chou的伪氨基酸组成概念,用近似熵表示蛋白质序列的附加特征,组成新的伪氨基酸组成表示序列特征.将蛋白质序列看作短时间序列,近似熵能够区分不同亚细胞定位中序列的复杂度.结合多个模糊K近邻分类器(基本分类器)的集成分类器作为预测工具.以不同维数的伪氨基酸组成向量,作为每个基本分类器的输入数据.3个常用的数据集用来测试算法的性能,Jackknife测试结果表明新算法有效和实用.有望发展成为亚细胞定位研究的有用工具.  相似文献   

8.
利用相似规则、互补规则和分子识别理论建立一种氨基酸数字编码模型用于研究序列特征、功能预测。给出一种新的基于元胞自动机的蛋白质序列图像生成方法,其优点是考虑了氨基酸前后的相互作用,生成的图像与基因序列一一对应,许多隐藏在蛋白质序列中的重要特性通过元胞自动机图可以表现出来。基于蛋白质元胞自动机图所得到的蛋白质伪氨基酸成分,蛋白质亚细胞定位预测成功率可以达到86.4%。  相似文献   

9.
蛋白质亚细胞定位是蛋白质组学基本问题之一。某些类型蛋白质可能存在于两个或两个以上的亚细胞位置,这类蛋白质的亚细胞定位问题更为复杂。分别利用Gene Ontology和伪氨基酸成分法,将一条蛋白质表示为一实值向量;采纳多标记学习中的Ranking思想,计算出一得分向量V,该向量的每一分量的值表示被预测蛋白质属于某个亚细胞位置的概率;利用最近邻算法预测蛋白质所属亚细胞位置的个数n,得分向量V中得分最高的n个分量对应的亚细胞位置即为预测的位置。  相似文献   

10.
基于GM(2,1)的亚细胞定位预测   总被引:2,自引:0,他引:2  
林卫中  肖绚 《计算机工程》2009,35(8):225-226
对于蛋白质氨基酸序列,使用GM(2,1)模型的参数作为伪氨基酸成分,加上各氨基酸在序列中所占比例,构成蛋白质的灰色伪氨基酸成分表示。利用扩大协方差算法预测亚细胞定位,开发基于该方法的亚细胞定位预测服务器。在相同的数据集上,对比实验结果显示,该预测服务器在总体预测率上达到77.6%,比其他预测方法优越。相关的研究拓展了灰色理论在生物信息学上的应用。  相似文献   

11.
人类胞内蛋白半衰期与其亚细胞定位的相关性研究   总被引:6,自引:0,他引:6  
胞内蛋白的稳定性直接影响着生命活动与细胞周期.蛋白的选择性降解是通过泛素-蛋白酶体途径实现的,它是蛋白消亡的主要方式之一,同时也是细胞主动调节自身状态的体现.蛋白的稳定性除了与自身序列和结构相关外,还和成熟蛋白所处的细胞内环境,即蛋白的亚细胞定位有关.本文主要从蛋白质在细胞中的区域化分布角度研究其与蛋白寿命的关系.结合大量的蛋白半衰期实验数据以及生物信息数据库,文章统计并分析了每个蛋白的定位信息,并进一步研究了与定位有关的信号肽情况,以及应用F检验筛选出了部分能够显著区分长短寿命蛋白的N端序列特征.结果表明胞内蛋白半衰期与其亚细胞定位之间存在一定的关联性.短寿命蛋白往往定位于细胞膜或者膜性囊泡结构上,大多由信号肽引导定位,作为细胞的分泌蛋白、信号转导蛋白或者功能性蛋白发挥作用并迅速降解;而长寿命蛋白多数属于持家蛋白,定位于细胞胞浆中或直接在胞浆中合成,作为细胞骨架或者发挥着支撑细胞的作用.另外,蛋白的区域化分布影响着蛋白质的折叠、聚合以及翻译后修饰,这些过程与蛋白的稳定性有着密切的联系.本研究为将来蛋白稳定性的深入研究提供了新的思路,同时也为生物信息学中开发蛋白质稳定性相关的预测工具提供了参考.  相似文献   

12.
基于DV-Hop定位算法和RSSI测距技术的定位系统   总被引:4,自引:1,他引:4  
针对 DV Hop算法在实验环境中存在的问题,加入接收信号强度指示器(RSSI)测距模块辅助定位,对算法进行改进。为了实现定位系统,首先,需要建立当前实验环境的RSSI模型;然后,应用该模型,从锚节点和非锚节点两方面分别控制DV Hop定位过程。实验证明:改进后的定位系统在增加少量计算复杂度的情况下,改善了系统的稳定性,提高了定位的精度,可以被应用到无线传感器网络中。  相似文献   

13.
In this study, we describe a phage display strategy to obtain human monoclonal single-chain Fv (scFv) antibodies binding target cancer cell surface proteins. By developing a cancer cell immunization protocol for SCID mice engrafted with human peripheral blood lymphocytes in combination with an antibody phage display method, we have isolated phage antibodies binding small-cell lung cancer cell line H889 by subtractive selection. One of the isolated scFv antibodies, 12EAb, recognized the E2 component of pyruvate dehydrogenase complex (PDC-E2) by immunoprecipitation according to MALDI-TOF MS analysis. Furthermore, we have confirmed the plasma membrane localization of PDC-E2 in small-cell lung cancer cells by immunocytochemistry and cell surface protein biotinylation, although PDC-E2 is usually located in the mitochondrial matrix. These results, including unique localization of identified antigens, were obtained by proteomic approaches. The present methods can be applied to generate human monoclonal scFv antibodies against tumor cells and to identify new molecular targets for immunotherapy and markers for diagnosis.  相似文献   

14.
通过分析和仿真,指出距离无关的无线传感器网络定位算法DV-Hop在节点分布密度不均匀的网络中的局限性.由此,提出一种新的定位算法.该算法中,各节点感知周边的节点密度,基于此对周边锚节点分区,利用相同区域的锚节点执行定位计算.通过仿真验证,在节点分布密度不均的网络中,该算法有效地降低了未知节点的定位误差,提高了定位精度.  相似文献   

15.
提出了一种连接主义方法, 利用移动机器人自身的时空经验, 在缺乏全局坐标信息和环境先验模型的情况下, 建立面向目标的认知地图. 在线形成的时序处理网络 (TSPN)可提供简洁的历史感知信息, 以神经元激活特性保存空间知识, 引导机器人运动. 结合TSPN和反应式行为模块的导航系统可实现动态的路标及方向检测、路径学习和实时导航功能. 仿真和实际实验验证了系统的有效性和适应性.  相似文献   

16.
针对传统机器学习算法中仍需手工操作表示特征的问题,提出了一种基于堆栈式降噪自编码器(SDAE)深度网络的蛋白质亚细胞定位算法。首先,分别利用改进型伪氨基酸组成法(PseAAC)、伪位置特异性得分矩阵法(PsePSSM)和三联体编码法(CT)对蛋白质序列进行特征提取,并将这三种方法得到的特征向量进行融合,以得到一个全新的蛋白质序列特征表达模型;接着,将融合后的特征向量输入到SDAE深度网络里自动学习更有效的特征表示;然后选用Softmax回归分类器进行亚细胞的分类预测,并采用留一法在Viral proteins和Plant proteins两个数据集上进行交叉验证;最后,将所提算法的结果与mGOASVM、HybridGO-Loc等多种现有算法的结果进行比较。实验结果表明,所提算法在Viral proteins数据集上取得了98.24%的准确率,与mGOASVM算法相比提高了9.35个百分点;同时所提算法在Plant proteins数据集上取得了97.63%的准确率,比mGOASVM算法和HybridGO-Loc算法分别提高了10.21个百分点和4.07个百分点。综上说明所提算法可以有效提高蛋白质亚细胞定位预测的准确性。  相似文献   

17.
李昂  毛晓光  雷晏 《计算机科学》2015,42(12):102-104, 107
为了应对日益增长的软件修复开销,研究高效的软件自动修复技术成为学术界和工业界的共识。缺陷定位作为自动修复技术的前端,是实现快速准确自动修复的关键,其精度直接影响自动修复的性能。然而,初步研究表明,现有缺陷定位技术缺乏对自修复需求的考虑,对自修复算法支持有限。有必要研究面向自修复的高精度自动化缺陷定位技术,以提升自修复性能。因此,提出了失效场景的缺陷定位方法来应对该问题。提出的方法首先采用程序切片技术,构造出与失效相关的场景;然后对失效场景的各个元素实施可疑值度量;最后将可疑值度量化的场景交给自动修复技术实施修复。初步实验结果表明,本缺陷定位方法能有效提升自动修复性能。  相似文献   

18.
针对传统机器学习算法中仍需手工操作表示特征的问题,提出了一种基于堆栈式降噪自编码器(SDAE)深度网络的蛋白质亚细胞定位算法。首先,分别利用改进型伪氨基酸组成法(PseAAC)、伪位置特异性得分矩阵法(PsePSSM)和三联体编码法(CT)对蛋白质序列进行特征提取,并将这三种方法得到的特征向量进行融合,以得到一个全新的蛋白质序列特征表达模型;接着,将融合后的特征向量输入到SDAE深度网络里自动学习更有效的特征表示;然后选用Softmax回归分类器进行亚细胞的分类预测,并采用留一法在Viral proteins和Plant proteins两个数据集上进行交叉验证;最后,将所提算法的结果与mGOASVM、HybridGO-Loc等多种现有算法的结果进行比较。实验结果表明,所提算法在Viral proteins数据集上取得了98.24%的准确率,与mGOASVM算法相比提高了9.35个百分点;同时所提算法在Plant proteins数据集上取得了97.63%的准确率,比mGOASVM算法和HybridGO-Loc算法分别提高了10.21个百分点和4.07个百分点。综上说明所提算法可以有效提高蛋白质亚细胞定位预测的准确性。  相似文献   

19.
Many localization algorithms and systems have been developed by means of wireless sensor networks for both indoor and outdoor environments. To achieve higher localization accuracy, extra hardware equipments are utilized by most of the existing localization solutions, which increase the cost and considerably limit the location-based applications. The Internet of Things (IOT) integrates many technologies, such as Internet, Zigbee, Bluetooth, infrared, WiFi, GPRS, 3G, etc., which can enable different ways to obtain the location information of various objects. Location-based service is a primary service of the IOT, while localization accuracy is a key issue. In this paper, a higher accuracy localization scheme is proposed which can effectively satisfy diverse requirements for many indoor and outdoor location services. The proposed scheme composes of two phases: (1) the partition phase, in which the target region is split into small grids; (2) the localization refinement phase, in which a higher accuracy of localization can be obtained by applying an algorithm designed in the paper. A trial system is set up to verify correctness of the proposed scheme and furthermore to illustrate its feasibility and availability. The experimental results show that the proposed scheme can improve the localization accuracy.  相似文献   

20.
本文研究了无线传感网络( Wireless Sensor Network,WSNs)的节点定位问题,并针对APIT由于锚节点在低密度环境下的节点误判和节点失效等问题给出了改进,在APICT定位算法的基础提出了联合分步定位算法UNION-APICT(Union Approximate Point-In-Circumcircle Test),该算法是结合连通性的测距技术,RSSI测距技术以及质心定位和APICT等技术,来联合解决对未知节点定位问题。通过仿真实验结果表明,改进后的UNION-APICT在APICT算法的基础之上平均定位误差减少了10%-25%,定位性能有了明显的提升;随着通信半径R和最大探测距离rmax的增加,定位误差也在逐渐减小,该算法较APIT和APICT定位算法在锚节点密度、节点覆盖率和定位精度上都有所提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号