首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
从天然氨基酸的50个性质参数中经主成分分析得出1种新的氨基酸描述子:氨基酸特征性质得分.并在此基础上通过定义基于向量形式的自相关函数以及引入Mercer核技术将该函数运算空间进行非线性变换,最终提出了1种新的蛋白质序列表征方法:核序列自相关函数.采用该函数对632个已知晶体结构的非同源蛋白分类研究结果表明:KSACF能...  相似文献   

2.
一种基于子序列分布的蛋白质结构类预测方法   总被引:2,自引:4,他引:2  
蛋白质结构类预测方法的预测能力主要取决于两个方面:一方面,方法采用的序列描述中包含多少有效的蛋白质结构类信息;另一方面,方法采用的判别函数对序列描述中包含的有效信息的利用程度。子序列分布是蛋白质结构类预测中的一种新的序列描述,广义平方距离是组分耦联方法中的判别函数,它包含序列描述中不同组分之间的耦合效应。本文改进了组分耦联方法中的判别函数,解决了当协方差矩阵不可逆时组分耦联方法不能解决的问题,从而把子序列分布与包含耦合效应的判别函数结合起来,对Chou等选取的含有359个蛋白质(结构域)的训练集做了预测,自检测和jackknife检测结果分别为100%和96.7%,这一结果比组分耦联方法提高了5.6和12.6个百分点,比基于自相关函数方法提高了3.3和6.2个百分点。  相似文献   

3.
在7个数据集上对3种不同聚类算法与3种不同相似性度最标准的多种组合进行实验,以评估这些因素对聚类性能的影响.为便于确定聚类参数,提出一种针对蛋白质结构预测的聚类中心选择算法.实验结果表明,在3种相似性度量标准中,RMSD对于聚类的效果最好,而在3种聚类算法中,SPICKER性能最优,其次是AP聚类算法.  相似文献   

4.
氨基酸序列的特征描述是指从一条氨基酸序列选取相关的特征信息并用数学方法描述这些信息,使之能正确反映序列与结构或功能之间的关系。在根据氨基酸序列预测蛋白质的结构类或亚细胞位置等问题中,氨基酸序列的特征描述直接影响预测质量;同时比较不同描述方法对预测结果的影响可以帮助我们理解序列与结构或序列与功能之间的关系。本文介绍了几种氨基酸序列的特征描述方法,以FDOD方程作为判别函数,比较了其中几种描述方法对蛋白质结构类预测结果的影响,发现二级结构单纯的全α类和全β类蛋白质对于氨基酸组成比较敏感,而对于混合型蛋白质,即α+β类和α/β类蛋白质,考虑氨基酸残基排列顺序可以显著提高预测结果。  相似文献   

5.
基于ANN蛋白质结构预测方法研究   总被引:2,自引:0,他引:2  
为了破译遗传信息传递的全过程,确定蛋白质空间结构与其功能之间的关系从而改造天然蛋白质,首先简要介绍了蛋白质结构预测的研究意义,然后回顾了用ANN预测蛋白质结构的研究,并分析了各算法的特点和效果,最后探讨了用ANN预测蛋白质结构的研究方向。通过把800个预测网络和126个蛋白质序列的标准集合,平均每个残基的二级结构预测精度为80%,每个链的精度范围为55%-100%,整体均值为80.5%  相似文献   

6.
在远同源检测的蛋白质结构预测方法中,基于支持向量机的方法取得了优于其他方法的高准确性,但这类方法只能完成对目标蛋白质作出是否属于特定蛋白质结构的判别,而实际应用中常需要直接给出具体的结构预测结果.提出一种基于多类支持向量机的蛋白质结构预测方法,通过采用加权一对多的多类分类方法对标准支持向量机输出结果进行综合评价,获得唯...  相似文献   

7.
为了动态优化存储系统中数据的分布,存储系统需要能动态发现密集I/O区域和预测未来密集I/O访问的区域,并根据发现和预测的结果来指导存储系统的优化。为此,本文根据存储系统的特点提出了实用且高效的基于连续度的聚类算法来发现密集I/O访问的区域,并采用ARMA时间序列模型来预测密集I/O可能访问的区域。为提高预测的准确性,采用了动态参数估计的策略。通过大量实验的结果验证了这两种算法的正确性和预测的准确性,对存储系统的优化具有较好的指导作用。  相似文献   

8.
传统的预测方法在构造特征向量时只考虑了氨基酸的组成,而自相关系数不仅能够很好地反映序列中氨基酸的位置信息,而且考虑了序列内部不同位置的氨基酸间的相互影响。设计了一种将氨基酸组成和自相关系数相结合的方法来构造特征向量;在Chou提出的伪氨基酸组成模型(pseudo.aminoacidcomposition,PseAAC)的基础上,通过扩展信息重新构造了伪氨基酸组成模型,并将其与自相关系数组合在一起来构造特征向量。分别使用两种方法编码,选用支持向量机作为预测工具,在数据集Z277、Z498以及独立测试集D138上进行了若干实验,对比结果显示,新方法比传统的氨基酸组成方法的准确率分别平均提高了7.43%和8.53%,证明了新方法是有效的。  相似文献   

9.
后基因组时代的到来,蛋白质的数据量急剧增长.为对蛋白质结构进行准确预测,提出了一种深度学习的方法,来预测蛋白质的二级结构分类问题.采用由近似熵、疏水模式以及图像特征组成的伪氨基酸组分方法,来提取蛋白质序列的特征;预测模型采用了5层的深度玻尔兹曼机(DBM)+分类层,5层的DBM组成了4个RBM,分类层采用softmax分类器;同时采用了非监督学习和监督学习作为预测模型的训练策略.与现有预测方法相比,提出的预测方法,比目前较好的支持向量机(SVM),人工神经网络(ANN)精度均要高.实验结果表明,提出的改进方法具有很好的可行性和有效性.  相似文献   

10.
一种用于蛋白质结构聚类的聚类中心选择算法   总被引:1,自引:0,他引:1  
黄旭  吕强  钱培德 《自动化学报》2011,37(6):682-692
提出一种对蛋白质结构聚类中心进行选择的算法. 聚类是蛋白质结构预测过程中必不可少的一个后处理步骤, 而目前在蛋白质结构预测中常用的属性阈值(Quality threshold, QT)聚类算法依赖于由经验得出的聚类半径; 其他聚类算法, 如近邻传播(Affinity propagation, AP)聚类算法也存在影响聚类分布的参数. 为克服对主观经验参数的依赖,本文提出一种聚类中心选择算法(Exemplar selection algorithm, ESA), 用于对不同参数下的聚类结果进行分析,从而选择最佳聚类中心,进而确定聚类半径等经验参数. 该算法在真实蛋白质结构数据集上进行了实验,在未知经验参数情况下选择出最佳聚类中心, 同时也为不同聚类算法寻找适合相应数据集的客观聚类参数提供了支持.  相似文献   

11.
蛋白质二级结构类型预测是当今生物信息学研究的热点之一。利用氨基酸数字编码模型将氨基酸序列转换成数字信号,根据LZ复杂度的算法计算了氨基酸的伪氨基酸成分,再对伪氨基酸成分用OET-KNN算法进行分类预测。Jackknife测试结果表明该算法能使得预测成功率有较大的提高。  相似文献   

12.
从氨基酸的物化特性出发,利用物理学中“粗粒化”思想,提出了一种蛋白质序列的分组重量编码方法(Encoding Basedon Grouped Weight,简记为EBGW),并结合组分耦联算法进行结构型预测的研究。对标准集T359中359个蛋白质的Resubstitution检验和Jack-knife检验预测准确性分别达到99.72%和91.09%,其中Jack-knife检验总体预测精度比相同条件下采用氨基酸组成编码的方法提高了约7%,特别是α+β类的预测精度提高了15%。实验结果表明蛋白质序列的EBGW编码方法能够有效地提取字母序列中蕴含的结构信息。  相似文献   

13.
蛋白质二级结构预测方法研究   总被引:2,自引:2,他引:0       下载免费PDF全文
为提高蛋白质二级结构预测精度,提出一种新的网络模型和编码方法。首先利用基因表达式编程(GEP)的全局搜索能力同时进化设计神经网络的结构和连接权;其次,对神经网络输入层编码进行了改进,添加了氨基酸残基所处的疏水环境。用PDBSelect25中的36条蛋白质共6 122个残基进行测试,结果表明提出的网络模型和编码方法能有效提高蛋白质二级结构预测的精度。  相似文献   

14.
蛋白质二级结构预测方法的评价   总被引:5,自引:3,他引:5  
蛋白质结构预测是后基因组时代的一项重要任务,蛋白质二级结构预测是蛋白质结构预测的关键步骤。现在一般认为,如果蛋白质二级结构的预测准确率达到80%的话,就可以基本准确地预测一个蛋白质分子的三维空间结构。目前蛋白质二级结构预测的方法不断涌现,提供二级结构预测的网站也逐渐增多。为给广大研究工作者在选择使用这些预测方法时提供一种参考,文章采用统一的标准对10种比较重要而且有效的方法进行测试,并在此基础上做出评价和分析,这10种方法是:GORI、PROF、GORⅣ、NNPREDICT、PHDsec、SSpro v 2.0、PSIPRED、PREDATOR、SOPMA和APSSP2。比较结果显示:APSSP2、SSpro v 2.0和PSIPRED方法的预测效果较好,可以作为使用时的首选方案,其中尤其以APSSP2方法的预测效果最佳。  相似文献   

15.
编码方式是影响蛋白质二级结构预测准确率的重要因素之一。针对单序列蛋白质二级结构预测问题,提出了一种新的综合编码方法。该编码是根据氨基酸出现在每种二级结构中的倾向因子以及氨基酸的疏水性值进行分类,并以二进制形式来表示每类氨基酸的编码方法。在相同的实验条件下,首先用不同的编码方式对数据集CB513进行编码,然后采用支持向量机的方法进行训练建模预测。实验结果显示提出编码的预测准确率比20位正交编码和5位编码分别高出1.48%和10.68%。可见,该编码比较适合非同源或低同源蛋白质结构预测。  相似文献   

16.
神经网络具有容易陷入局部极小的缺点,动态隧道神经网络通过“钻隧道”方式,让目标函数跳出局部最小,找到更小的可行域,从而避免神经网络陷入局部极小。传统的动态隧道技术隧道方向单一并且随意,因此具有不稳定性。为了有效提高动态隧道的搜索效率,提出了一种改进型动态隧道神经网络算法。该算法增加搜索的隧道数,引入夹角弹性系数控制隧道方向,考察隧道之间的相互影响。在对alpha、beta和coil型蛋白质的二级结构预测的实验中,改进型动态隧道神经网络算法预测的效果优于神经网络算法和传统的动态隧道神经网络算法。  相似文献   

17.
基于DNA分子二级结构的结构稳定性和热力学稳定性,提出一种预测DNA分子二级结构的算法.利用基于矩阵的动态规划算法求解DNA分子最大碱基对匹配的所有二级结构;利用Nearest-Neighbor热力学模型计算所有结构的自由能,自由能在阈值范围内的即为DNA分子可能的二级结构.将实验结果与RNAstructure软件结果进行对比,对比结果表明,该方法具有较高的准确率和覆盖范围.  相似文献   

18.
王艳春 《计算机应用研究》2009,26(10):3687-3689
为提高蛋白质二级结构预测的精度,提出了一种基于GEP-BP网络集成的两层结构预测模型。首先利用基因表达式编程(GEP)的全局搜索能力同时进化设计BP网络的结构和连接权,并将进化最后一代的个体用BP算法进一步训练学习,然后采用组合方法将部分个体集成构成模型的第一层;根据神经网络输出之间具有相关性,用第二层网络对第一层的预测结果进行精炼。用PDBSelect25中的36条蛋白质共6 122个残基进行测试,结果表明提出的模型能有效预测蛋白质二级结构,将预测精度提高到73.02%。  相似文献   

19.
应用ANN/HMM混合模型预测蛋白质二级结构   总被引:1,自引:1,他引:0  
针对3状态隐马尔可夫模型(hidden Markov model,HMM)预测蛋白质二级结构准确率不高的问题,提出15状态HMM,通过改进的算法与BP神经网络相结合进行二级结构预测。研究对象为CB513数据集中筛选出的492条蛋白质序列,将其随机均分7组。应用混合模型进行预测,对准确率进行7交叉验证,Q3准确率达7721%,SOV值为7252%。结果表明,混合模型既能充分考虑相邻氨基酸残基间的相互影响,也能在一定程度上照顾二级结构的远程相关性,因此带来了较好的预测准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号