共查询到20条相似文献,搜索用时 375 毫秒
1.
在计算生物学中,根据蛋白质的氨基酸序列预测蛋白质的结构是尚未解决的重要问题之一,而其中的1个难点是预测蛋白质中Loop片段的结构.本文用1阶马尔可夫模型为基础,通过对其训练,可根据氨基酸串和2级结构信息为蛋白质Loop片段概率建模和采样.其中用Ramachandmn图示法的二面角对描述蛋白质结构,模型的训练和推理通过工具包Mocapy来完成.并使用KL交叉熵和角度差异值作为实验检验标准来完成Loop分布情况的测试实验,同时在从头预测Loop结构实验中预测CASP8中8个自由建模的蛋白质结构.与最流行的方法相比,本文提出的模型因为改进了Loop段的预测精度,从而可使得到的二面角对更加接近真实Loop结构中分布,同时在从头预测中提高整个蛋白质结构的预测精度.并且由于本文的模型具有概率推理特性,故在理论上也更具有无偏见性. 相似文献
2.
编码方式是影响蛋白质二级结构预测准确率的重要因素之一。针对单序列蛋白质二级结构预测问题,提出了一种新的综合编码方法。该编码是根据氨基酸出现在每种二级结构中的倾向因子以及氨基酸的疏水性值进行分类,并以二进制形式来表示每类氨基酸的编码方法。在相同的实验条件下,首先用不同的编码方式对数据集CB513进行编码,然后采用支持向量机的方法进行训练建模预测。实验结果显示提出编码的预测准确率比20位正交编码和5位编码分别高出1.48%和10.68%。可见,该编码比较适合非同源或低同源蛋白质结构预测。 相似文献
3.
胡世涛 《计算机光盘软件与应用》2012,(19):71-72
在蛋白质结构预测算法中同源建模被认为是当前最成功的预测算法,文中指出了同源建模算法存在的缺陷,并且针对这一缺陷设计出改进算法。基于结构信息的目标模板比对算法,对搜索敏感度和比对准确度等方面有所提高。 相似文献
4.
选取合适的蛋白质结构预测算法的性能评估指标,是直接影响到衡量和比较各种蛋白质结构预测算法优劣的重要问题。本文对目前各种评估指标进行了剖析比较,总结对比了各种评估指标的优缺点,分析了其相互之间的联系与区别,并结合神经网络建模,提出各种评估指标的适用范围与使用原则。 相似文献
5.
提出基于蛋白质长度信息和深度卷积神经网络分类建模的方法(Length Information and Deep Convolu-tional Neural Networks,LIM-DCNN),实现对于蛋白质二级结构的预测.实验得到的6分段模型,预测CASP9、CASP10、CASP11、CASP12和CB513的Q3准确率分别为83.67%、78.99%、78.53%、71.52%和85.94%,说明了基于蛋白质长度分类建模的有效性,并且实验得到的CB513结果明显优于其他许多经典的预测算法. 相似文献
6.
7.
蛋白质侧链预测是蛋白质结构预测以及蛋白质设计中非常重要的子问题,而旋转异构体库的构造是进行侧链预测的基础,为预测提供搜索空间.现有的旋转异构体库考虑的是单个氨基酸的统计信息,没有考虑与之相邻的氨基酸对其构象产生的影响.本文提出一种基于隐马尔科夫模型的旋转异构体库构造方法,将相邻氨基酸的构象信息也考虑进来,产生与序列相关的旋转异构体库.并采用蛋白质预测程序Rosetta对CASP8中的12个自由建模蛋白质在本文提出的旋转异构体库基础上进行侧链预测,与基于经典的旋转异构体库的侧链预测结果相比,在预测精度上有了一定的提高. 相似文献
8.
蛋白质三维结构决定了其特殊的生物功能,蛋白质三维结构对蛋白质功能研究、疾病的诊断与治疗、创新药物研发都有着重要的科学意义。利用计算机技术从氨基酸序列预测蛋白质三维结构是获取蛋白质三维结构的有效方法。片段组装是一种广泛采用的蛋白质结构预测技术,它将连续的构象空间优化问题转换成离散的实验片段组合优化问题,从而有效地减小了构象搜索空间。首先介绍了片段组装技术;其次总结了基于片段组装的蛋白质结构预测的发展历程,并对部分具有代表性的方法进行了简要阐述;然后介绍了蛋白质结构预测研究中常用的数据库和评价指标,并比较了不同预测方法的性能;最后分析并指出了当前基于片段组装的蛋白质结构预测方法所存在的挑战性问题,并对该领域未来的研究方向进行了展望。 相似文献
9.
10.
蛋白质结构预测方法的研究进展 总被引:11,自引:0,他引:11
殷志祥 《计算机工程与应用》2004,40(20):54-57
目前,在蛋白质结构预测方面,人们努力发展新的方法,该文主要介绍了蛋白质结构预测的方法和进展。详细地综述了几种方法,并简单地介绍了蛋白质结构预测的几个不同阶段,并提出了在蛋白质结构预测方面存在的一些困难。 相似文献
11.
BP神经网络在蛋白质二级结构预测中的应用 总被引:1,自引:1,他引:0
蛋白质结构预测是生物信息学研究的重要问题,而蛋白质二级结构预测是蛋白质结构预测的关键步骤.文中通过BLAST工具得到Identity小于等于35%的46个蛋白质复合物的单链作为数据集,分别采用5位编码和Profile编码,通过不同大小的滑动窗口,对蛋白质二级结构进行预测.实验结果显示,富含"生物进化信息"的Profile编码有着明显的优势,各种精确度均得到了较好的结果,尤其是精确度QE明显高于5位编码的QE. 相似文献
12.
采用1种基于Boosting理论的回归建模算法Boosting-偏最小二乘法(BPLS),建立了奶粉中蛋白质含量的近红外模型.先用Kemard-Stone法构建样本训练集和预测集,继对所有样本的近红外光谱进行中心化处理,用BPLS算法进行建模,并对收缩因子v与迭代次数m这2个重要参数进行了优化,当收缩因子为0.9,迭代次数为882时,所建模型的预测结果最好,预测均方根误差(RMSEP)为0.3159,明显优于偏最小二乘法.结果表明:BPLS算法具有提高模型的预测精度的显著优势,可实现奶粉中蛋白质含量的快速、无损测定. 相似文献
13.
基于Toy模型蛋白质折叠预测的多种群微粒群优化算法研究 总被引:1,自引:0,他引:1
基于Toy模型的蛋白质折叠结构预测问题是一个典型的NP问题.提出了多种群微粒群优化算法用于计算蛋白质能量最小值.该算法采用了一种新的算法结构,在该结构中,每一代的种群被分为精英子种群、开采子种群和勘探子种群三部分,通过改善种群的局部开采能力和全局勘探能力来提高算法的性能.分别采用Fibonacci蛋白质测试序列和真实蛋白质序列进行了折叠结构预测的仿真实验.实验结果表明该算法能够更精确地进行蛋白质折叠结构预测,为生物科学研究提供了一条有效途径. 相似文献
14.
从头预测是蛋白质结构建模的一种重要方法,该方法的研究有助于人类理解蛋白质功能,从而进行药物设计和疾病治疗。为了提高预测精度,文中提出了基于接触图残基对距离约束的蛋白质结构预测算法(CDPSP)。基于进化算法框架,CDPSP将构象空间采样分为探索和增强两个阶段。在探索阶段,设计基于残基对距离的变异与选择策略,即根据接触图的接触概率选择残基对,并通过片段组装技术对所选择的残基对的邻近区域进行变异;将残基对距离离散化为多个区域并为其分配期望概率,根据期望概率确定是否选择变异的构象,从而增加种群的多样性。在增强阶段,利用基于接触图信息的评分指标,结合能量函数,衡量构象的质量,从而选择较优的构象,达到增强CDPSP近天然态区域采样能力的效果。为了验证所提算法的性能,通过CASP12中的10个FM组目标蛋白质对其进行了测试,并将其与一些先进算法进行比较。实验结果表明,CDPSP可以预测得到精度较高的蛋白质三维结构模型。 相似文献
15.
16.
从低同源关系的氨基酸序列预测蛋白质的三维结构被称为从头预测,它是计算生物学领域中的挑战之一.蛋白质骨架预测是从头预测的必要先导步骤.本文应用一种基于共享信息素的并行蚁群优化算法,在现有能量函数指导下,通过不同能量项之间的定性互补,构建具有最低能量的蛋白质骨架结构,并通过聚类选择构象候选集合中具有最低自由能的构象.在CASP8/9所公布的从头建模目标上应用了该方法,CASP8的13个从头建模目标中,模型1中有2个目标的预测结果超过CASP8中最好的结果,7个位列前10名;CASP9的29个从头建模目标中,候选集中的最佳结果中有20个进入Server组的前10名,模型1中有11个进入前10名.本文的结果说明融合多个不同的能量函数指导并行搜索,可以更好地模拟天然蛋白质的折叠行为.同时,在本算法载体上实现了不同种类搜索策略的融合并行,对于用非确定性算法解决类似的优化问题来说也是一种新颖的方法. 相似文献
17.
18.
预测蛋白质二级结构,是当今生物信息学中一个难以解决的问题.由于预测蛋白质二级结构的精度在蛋白质结构研究中起到非常重要的作用,因此在基于KDTICM理论基础上,提出一种基于混合SVM方法的蛋白质二级结构预测算法.该算法有效地利用蛋白质的物化属性和PSI-SEARCH生成的位置特异性打分矩阵作为双层SVM的输入,从而大大地提高了蛋白质二级结构预测的精度.实验比较分析表明,新算法的预测精度和普适性明显优于目前其他典型的预测方法. 相似文献
19.
为了从蛋白质结构数据库中提取经验知识,进行蛋白质作用位点预测,提出了以蛋白质序列谱作为特征向量,采用支持向量机算法进行训练和预测蛋白质相互作用位点的方法。从蛋白质一级序列出发,以序列上邻近残基的序列谱为输入特征向量,采用支持向量机方法构建预测器,来预测蛋白质相互作用位点,预测精度达到70.47%,相关系数CC=0.1919。实验结果表明,利用蛋白质序列谱,结合支持向量机算法进行蛋白质相互作用位点预测的方法是有效的。 相似文献