首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
蛋白质相互作用位点预测为蛋白质功能和药物设计的理解提供重要线索。而蛋白质的各种特征为蛋白质相互作用位点预测提供了大量有用信息,特别是进化信息、残基序列邻近和空间邻近性。不同的蛋白质特征对蛋白质间的相互作用的贡献也不一样。通过提取蛋白质序列谱、保守性和残基熵,提出了特征融合技术对蛋白质相互作用位点进行研究,采用SVM构建三种预测器,分别对各种不同的特征加以验证,实验结果表明了基于特征融合方法的有效性和正确性。  相似文献   

2.
蛋白质的功能对于理解细胞和生物的活动机制、研究疾病机理等至关重要。面对序列数据库的快速增长,传统的实验和序列对比方法不足以支撑大规模的蛋白质功能标注。为此,提出EGNet(evolutionary graph network)模型,采用蛋白质预训练语言模型ESM2和one-hot编码得到蛋白质序列编码,通过序列自注意力和物理计算整合出残基间的协同进化信息PI(paired interaction)和SPI(strong paired interaction);之后将两种进化信息和序列编码作为多层串联图卷积网络输入,学习序列编码节点特征,实现端到端的蛋白质功能预测。与早期方法相比,在ENZYME数据库中的EC(Enzyme Commission)类别标签上,EGNet获得了更好的性能,其F-score达到0.89,AUPR值达到0.91。结果表明,EGNet仅仅采用单条序列来预测蛋白质功能就可以得到良好的结果,从而能够提供快速且有效的蛋白质功能注释。  相似文献   

3.
蛋白质的功能常体现在生物大分子的相互作用中,识别蛋白质相互作用位点对于研究蛋白质功能发挥着重要作用.蛋白质问主要通过表面残基发生相互作用,蛋白质相互作用形成复合体时,只有部分表面残基参与了该过程.基于序列谱信息,提取序列上相邻残基的序列谱作为输入特征向量,对大小为3和7的残基信息窗(win3,win7),分别采用支持向量机(SVM)分类器对蛋白质相互作用位点进行预测、比较和分析.最终实验结果为:win3的平均正确率为69.31%,win7的平均正确率为69.68%.  相似文献   

4.
鉴于不同类型氨基酸的相互作用对蛋白质结构预测的影响不同,文中融合卷积神经网络和长短时记忆神经网络模型,提出卷积长短时记忆神经网络,并应用到蛋白质8类二级结构的预测中.首先基于氨基酸序列的类别信息和氨基酸结构的进化信息表示蛋白质序列,并采用卷积提取氨基酸残基之间的局部相关特征,然后利用双向长短时记忆神经网络提取蛋白质序列内部残基之间的远程相互作用,最后将提取的蛋白质的局部相关特征和远程相互作用用于蛋白质8类二级结构的预测.实验表明,相比基准方法,文中模型提高8类二级结构预测的精度,并具有良好的可扩展性.  相似文献   

5.
蛋白质的功能常体现在生物大分子的相互作用中,识别蛋白质相互作用位点对于研究蛋白质功能发挥着重要作用。蛋白质间主要通过表面残基发生相互作用,蛋白质相互作用形成复合体时,只有部分表面残基参与了该过程。基于序列谱信息,提取序列上相邻残基的序列谱作为输入特征向量,对大小为3和7的残基信息窗(win3,win7),分别采用支持向量机(SVM)分类器对蛋白质相互作用位点进行预测、比较和分析。最终实验结果为:win3的平均正确率为69.31%,win7的平均正确率为69.68%。  相似文献   

6.
杜秀全  程家兴  宋杰 《计算机工程》2010,36(18):203-204
蛋白质相互作用位点的预测是当前生物信息学的一个研究热点。针对蛋白质序列中对界面残基有影响的各种因素,提出将蛋白质的进化信息和保守性作为特征函数,此类信息体现了蛋白质序列中氨基酸之间短程和长程相互作用的影响。采用最大熵模型作为蛋白质作用位点识别的分类器,将多源信息融合成一个概率模型。实验结果表明该方法与其他传统机器学习方法相比,在特异度和精度上分别提高了2%~8%、3%~11%,且获得了较高的相关系数。  相似文献   

7.
特征向量的构造是蛋白质二级结构预测的一个关键问题. 现有的研究方法,通常只使用BLOSUM62进化矩阵生成PSSM矩阵,对蛋白质进化过程中存在的氨基酸残基突变现象缺乏考虑. 本文提出利用多重进化矩阵构造蛋白质特征向量,其融合了不同进化时间的PSSM矩阵,不仅能够很好地反映序列中氨基酸的位置信息,而且能够反映序列进化过程中氨基酸位点发生突变产生的影响. 本文通过组合不同进化程度的矩阵来构造特征向量,选用逻辑回归、随机森林和多分类支持向量机三种分类算法作为预测工具,利用网格搜索法和交叉实验法优化参数,在RS126、CB513和25PDB公用数据集上进行了若干组实验. 对比实验结果表明,本文所提出基于多重进化矩阵的蛋白质特征向量构造方法能够有效提高蛋白质二级结构的预测精度.  相似文献   

8.
蛋白质相互作用位点研究在蛋白质功能分析及药物设计等方面有着重要的应用。文章以蛋白质中的氨基酸残基为研究对象,使用残基的溶剂可及表面积、进化保守性打分及残基的序列信息熵三个特征为特征集,构建了基于贝叶斯方法的蛋白质相互作用位点预测的贝叶斯分类预测器。方法有效的结合了蛋白质残基特征数据集经常性数据缺失的特点及贝叶斯网在处理不确定性数据方面的优点,通过对基准的71个蛋白质数据集进行实验,结果表明我们的分类器预测的有效性。  相似文献   

9.
现有人体姿态动作识别方法忽视前期姿态估计算法的作用,没有充分提取动作特征,提出一种结合轻量级Openpose和注意力引导图卷积网络的动作识别方法。该方法包含基于shufflenet的Openpose算法和基于不同尺度邻接矩阵注意力的图卷积算法。输入视频由轻量Openpose处理得到18个人体关键点信息,表达为基础时空图数据形式。节点的不同尺度邻居信息对应的邻接矩阵通过自注意力机制计算影响力,将各尺度邻接矩阵加权合并输入图卷积网络提取特征。提取到的鉴别特征通过全局平均池化和softmax分类器输出动作类别。在Le2i Fall Detection数据集和自定义的UR-KTH数据集上的实验表明,动作识别的准确率分别为95.52%和95.07%,达到了预期效果。  相似文献   

10.
为了从蛋白质结构数据库中提取经验知识,进行蛋白质作用位点预测,提出了以蛋白质序列谱作为特征向量,采用支持向量机算法进行训练和预测蛋白质相互作用位点的方法。从蛋白质一级序列出发,以序列上邻近残基的序列谱为输入特征向量,采用支持向量机方法构建预测器,来预测蛋白质相互作用位点,预测精度达到70.47%,相关系数CC=0.1919。实验结果表明,利用蛋白质序列谱,结合支持向量机算法进行蛋白质相互作用位点预测的方法是有效的。  相似文献   

11.
针对当前大多数模型对交通流数据空间信息挖掘不充分、无法捕获长序列单元间的信息等问题,提出一种基于时域图卷积神经网络的交通流预测模型。通过阈值权重法重构邻接矩阵,将多层近邻机制嵌入图卷积网络进一步挖掘空间信息;引入时域卷积网络,借助膨胀因果卷积扩大感知野并结合残差网络提取时间信息;运用Dense网络输出结果。利用加州性能评估系统中两个数据集进行评估,其结果表明,该模型性能优于常用的基准模型以及最近提出的多时空图卷积网络模型。  相似文献   

12.
蛋白质二级结构预测方法研究   总被引:2,自引:2,他引:0       下载免费PDF全文
为提高蛋白质二级结构预测精度,提出一种新的网络模型和编码方法。首先利用基因表达式编程(GEP)的全局搜索能力同时进化设计神经网络的结构和连接权;其次,对神经网络输入层编码进行了改进,添加了氨基酸残基所处的疏水环境。用PDBSelect25中的36条蛋白质共6 122个残基进行测试,结果表明提出的网络模型和编码方法能有效提高蛋白质二级结构预测的精度。  相似文献   

13.
蛋白质结构的鲁棒性能够提高蛋白质在不稳定环境中保持生物功能的能力。用氨基酸网络表示超氧化物歧化酶(Fe-SOD)的结构,从研究氨基酸网络鲁棒性的角度研究Fe-SOD结构的鲁棒性。实验结果显示,氨基酸网络的鲁棒性比同等规模大小的随机网络的鲁棒性差。尤其以介数方式攻击,Fe-SOD氨基酸网络表现出明显的脆弱性。嗜热的Fe-SOD氨基酸网络的鲁棒性比常温的氨基酸网络的鲁棒性高。通过鲁棒性分析,识别氨基酸网络中关键残基,发现关键残基主要包括进化保守残基、疏水性残基、规则二级结构内部的残基以及Fe-SOD活性位点残基。与热稳定性低的Fe-SOD氨基酸网络相比,热稳定性高的Fe-SOD氨基酸网络中的关键残基较均匀地分布在Fe-SOD内部。关键残基在Fe-SOD结构中均匀分布,有利于提高嗜热Fe-SOD整体的稳定性。  相似文献   

14.
针对农产品期货价格波动的非线性及国内外期货产品的联动性特征,考虑到传统神经网络预测模型未能针对多源输入变量间的因果关系进行定量表征,构建融合传递熵的图神经网络预测模型。通过计算传递熵表示节点间的邻接矩阵,作为先验信息识别变量间的因果关系;设置多尺寸滤波器的时间卷积模块提取节点特征,用于识别序列时间依赖性;设置图卷积模块实现对节点信息及其邻域信息的传播与特征筛选,最后连接参数,输出最终的预测结果。在大豆期货数据上的实证研究表明,相较于现有的通用预测模型,该模型能够实现最佳的预测效果。  相似文献   

15.
蛋白质相互作用界面是蛋白质相互作用产生的物理载体。考虑蛋白质相互作用界面间的结构相似性对于研究蛋白质功能,信号传导网络和药物设计具有非常重要的意义,而现有的蛋白质结构比对算法仅适用于蛋白质单体的全局空间结构。我们给出了基于整数二次规划模型的方法来考虑蛋白质相互作用界面的比对问题,该方法整合了蛋白质序列的进化信息、结构信息,并用进化谱的相似性来对比对上的残基打分以衡量其进化保守性。通过计算实验,发现进化上和结构上保守的残基有可能就是对于蛋白质结合起重要作用的残基,即热点。  相似文献   

16.
在蛋白质组学中从头测序是串联质谱肽段测序的重要方法之一,其具有不依赖于蛋白质数据库的优势,并在测定未知物种蛋白序列、单克隆抗体测序等领域中起着关键作用。然而由于从头测序的复杂性,导致其测序的准确率远低于数据库搜索方法,制约了从头测序的广泛应用。针对从头测序准确率低的问题,提出一种基于图卷积神经网络(GCN)的从头测序方法denovo-GCN。该方法将质谱中谱峰之间的关系用图结构表示,并从每个相应的肽碎裂位点提取谱峰特征,然后通过GCN预测当前碎裂位点处的氨基酸类型,最后逐步组成完整的肽序列。通过实验确定了GCN模型的层数、离子类型组合和测序使用的谱峰数量这3个影响模型的重要参数,并将多个物种数据集用于实验对比。实验结果表明,该方法在肽水平上的召回率比基于图论的从头测序方法Novor、pNovo提高了4.0~21.1个百分点,比基于卷积神经网络(CNN)和长短期记忆(LSTM)网络的DeepNovo提高了2.1~10.7个百分点。  相似文献   

17.
目前,基于卷积神经网络和循环神经网络的方面级情感分析研究工作较少同时考虑到句子的句法结构和词语的语法距离,且卷积神经网络和循环神经网络无法有效地处理图结构的数据.针对上述问题,提出了一种基于距离与图卷积网络的方面级情感分类模型.首先,为该模型设计了一个具有残差连接的双层双向长短期记忆网络,用于提取句子的上下文信息;然后,根据句法依赖树得到词语的语法距离权重,并根据词语之间的句法关系构建邻接矩阵;最后,采用图卷积网络结合句子的上下文信息、语法距离权重和邻接矩阵提取方面的情感特征.实验结果表明,模型是有效的且可获得更好的性能.  相似文献   

18.
蛋白质相瓦作用位点在细胞进程中有着非常重要的作用.尽管利用高通量方法发现蛋白质相瓦作用位点取得很大的成功,仍需要计算方法辅助预测实验中的相互作用位点.本文提出了基于残基序列谱、进化率和疏水性的预测异源蛋白质复合物作用位点的两种向量表示方法并以支持向量机实现预测.其中,提出新的向量表示法取得更好的预测性能.文中的数据集由66个异源复合物蛋白质链组成.  相似文献   

19.
近年来,图神经网络逐渐成为深度学习领域广泛讨论的话题和研究的重点,但大多数研究都是基于图节点,在存在多维属性的前提下进行分类和回归预测,对单时序特征的图节点预测并不能产生理想的效果。本文提出一种时序图卷积网络算法,可以在复杂图网络中,只根据节点单一特征的时序序列,实现对该特征的预测。算法通过在传统图卷积网络中对邻接矩阵参数化,解决单一特征条件下的参数退化问题,并结合长短时记忆网络的序列学习方法,将时序信息融入到训练过程中,提高训练精度。在交通流量数据集PeMS和Los上的实验表明,其预测精度要优于GCN、T-GCN、GRU、LSTM等主流算法。  相似文献   

20.
论文从蛋白质序列数据的角度出发,通过序列相似度循环匹配构造蛋白质网络,并且通过网络节点重要性排序算法预测蛋白质功能.以节点重要性重要性作为研究对象,在蛋白质网络应用节点重要性算法PageRank计算网络中蛋白质节点PR值,在Hadoop平台上进行开发实现功能预测的并行计算,减小运行时间.最后通过准确率,召回率以及F1-measure三个指标来衡量结果,并对比传统的功能预测方法,验证结果的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号