首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
预测蛋白质二级结构,是当今生物信息学中一个难以解决的问题.由于预测蛋白质二级结构的精度在蛋白质结构研究中起到非常重要的作用,因此在基于KDTICM理论基础上,提出一种基于混合SVM方法的蛋白质二级结构预测算法.该算法有效地利用蛋白质的物化属性和PSI-SEARCH生成的位置特异性打分矩阵作为双层SVM的输入,从而大大地提高了蛋白质二级结构预测的精度.实验比较分析表明,新算法的预测精度和普适性明显优于目前其他典型的预测方法.  相似文献   

2.
应用计算智能方法分析,有效地处理现实世界中的大规模数据,是当今人工智能、机器学习等领域所追求的目标之一.简单综述了SVM用于处理大规模数据方法的发展现状,并针对蛋白质结构预测中数据量庞大、数据维数过高等问题,提出了SVM基于分解算法的蛋白质二级结构预测的实现方法,并应用固定长度的字符串核对多类分类SVM算法进行了改进.实验表明,该方法是行之有效的.  相似文献   

3.
决策树算法在蛋白质二级结构预测问题中的应用研究   总被引:1,自引:0,他引:1  
论文将决策树算法应用于蛋白质二级结构预测中,在蛋白质二级结构预测应用研究中,我们指出了在蛋白质二级结构预测问题中决策树分类属性的选择方法和决策树分类方法和决策树剪枝方法,并且比较了改进后的决策树算法和c45决策树算法在蛋白质二级结构预测问题中的应用效果。  相似文献   

4.
蛋白质二级结构预测在蛋白质空间结构预测中起着承上启下的重要作用。近年来,大量的方法应用于二级结构预测中,其中,神经网络算法效果较好。但是,由于传统的神经网络存在结构复杂、学习速度慢、运行效率低、处理海量数据困难的缺陷,大大影响了预测的效果,因此,该文将一种基于构造性神经网络算法,也就是交叉覆盖算法应用于蛋白质二级结构预测中,另外,为了引入更多的同源家族结构的信息,采用了基于概率的Profile编码方式。通过实验证明将交叉覆盖算法运用在蛋白质二级结构预测中的可行性.并且比传统的神经网络方法有了更高的准确率。  相似文献   

5.
为解决SVM、Bayes、RNN(recurrent neural network)等传统算法在蛋白质结构分类任务中精度低的问题,提出一种基于残差网络的蛋白质超二级结构图像分类方法.将PDB(protein data bank)和SCOP(structural classification of pro-teins)数据库中的4类蛋白质超二级结构3D模型转化为14角度拍摄的2D图像,针对每类图像,通过残差网络单元进行深度特征提取和优化,利用神经网络模型训练,将验证精度最高的模型保存下来并进行测试.实验结果表明,分类精度达到了90.2%,验证了模型的可行性和算法的有效性.  相似文献   

6.
氨基酸含量是影响蛋白质耐热性的主要因素,为了提高以氨基酸含量为特征向量的蛋白质耐热性预测的精度和预测模型的性能,提出了一种基于机器学习蚁群算法(ACO)优化支持向量机(SVM)参数的蛋白质耐热性预测方法。建立了SVM参数优化模型,探讨了基于网格划分策略的连续蚁群算法,通过对SVM的惩罚因子和径向基核函数的全局搜索,筛选出最优参数,使SVM的蛋白质耐热性预测率最优。结果表明:采用未优化的SVM建立的预测模型的蛋白质耐热性总预测率相对较低,约为76.5%,采用遗传算法优化预测模型参数后的预测率约为86.6%,采用ACO优化预测模型参数后预测率达到87.8%。采用ACO优化的SVM模型参数的寻优速度快,预测结果准确。  相似文献   

7.
蛋白质二级结构的协同训练预测方法*   总被引:1,自引:1,他引:0  
针对蛋白质二级结构机器学习预测方法,忽略氨基酸疏水性特征以及氨基酸之间的长程作用和准确率不高的现状,进行了比较实验分析。采用氨基酸对应的疏水能值替换蛋白质中相应的氨基酸,得到疏水能值的序列实验结果表明,用长的疏水能值序列,训练BP网络,对长程作用起主导的E结构的预测效果好。由于Profile编码特征和疏水能值特征是独立的冗余视图,基于协同训练思想,提出Cotraining算法。该算法的主要步骤是在Profile特征空间训练SVM分类器,在疏水性特征空间训练BP神经网络分类器,协同对氨基酸二级结构进行预测  相似文献   

8.
基于径向基函数蛋白质二级结构预测方法   总被引:3,自引:1,他引:2  
文章针对蛋白质二级结构预测这一复杂非线性模式分类问题,提出了基于径向基函数的预测方法。在分析了基于神经网络预测方法的基础上,讨论了蛋白质二级结构预测算法研究中的数据选取、网络结构与参数对网络性能的影响,实验结果表明这一方法的可行性和有效性。  相似文献   

9.
杨炳儒  周谆  侯伟 《计算机应用研究》2009,26(12):4617-4620
蛋白质二级结构预测问题,是生物信息学领域中最为重要的任务之一,历经三十多年的研究,已取得了一些进展,尤其是近来集成预测模型与混合预测模型的引入,为预测精度带来了一定程度的提高,然而其离从二级结构推导三级结构的目标,仍然存在很大差距。为了有效提高蛋白质二级结构预测精度,以KDTICM理论的扩展性研究与KDD*模型为基础, 使用基于KDD*模型的关联分析蛋白质二级结构预测方法KAAPRO,提出一种基于支持度与可信度的复杂距离度量的CBA(classification based on association)  相似文献   

10.
张蕾  李征  郑逢斌  杨伟 《计算机应用》2017,37(5):1512-1515
蛋白质二级结构预测是结构生物学中的一个重要问题。针对八类蛋白质二级结构预测,提出了一种基于递归神经网络和前馈神经网络的深度学习预测算法。该算法通过双向递归神经网络建模氨基酸间的局部和长程相互作用,递归神经网络的隐层输出进一步送入到三层的前馈神经网络以便进行八类蛋白质二级结构预测。实验结果表明,提出的算法在CB513数据集上达到了67.9%的Q8预测精度,显著地优于SSpro8和SC-GSN。  相似文献   

11.
王菲露  宋杨 《计算机仿真》2012,29(2):184-187
在生化实验中,关于优化蛋白质预测问题,由于采集的信息、参数、选取和设置等优化处理存在随机性,限制了蛋白质二级结构预测精确度。为解决上述问题,针对广义回归神经网络学习速率快、网络稳健的特点,提出基于广义回归神经网络预测蛋白质二级结构的方法。鉴于编码方式对预测精度有重要影响,首先基于5位编码和不同的滑动窗口构建多个广义回归神经网络预测器对蛋白质二级结构进行预测,取得了较好的结果。并采用富含生物进化信息的序列谱(Profile)编码构建输入向量、并针对不同大小的滑动窗口设置多个spread值重新创建广义回归神经网络预测器,大大提高了预测精确度,仿真结果证明了预测模型的有效性和可行性,为预测提供了有效方法。  相似文献   

12.
有效预测RNA二级结构是生物信息学中的重要研究领域.提出一种基于隐Markov模型预测RNA二级结构的新方法.首先,应用前后缀匹配算法快速找到所有可能(包括假结)的茎区,建立RNA-HMM,寻找最优的茎区组合方法,得到包含假结的RNA二级结构.实验结果表明,提出的新方法降低了计算复杂性,提高了预测的特异性和敏感性,具有较高的准确率,可以预测RNA的假结结构.  相似文献   

13.
Accurate protein secondary structure prediction plays an important role in direct tertiary structure modeling, and can also significantly improve sequence analysis and sequence-structure threading for structure and function determination. Hence improving the accuracy of secondary structure prediction is essential for future developments throughout the field of protein research.In this article, we propose a mixed-modal support vector machine (SVM) method for predicting protein secondary structure. Using the evolutionary information contained in the physicochemical properties of each amino acid and a position-specific scoring matrix generated by a PSI-BLAST multiple sequence alignment as input for a mixed-modal SVM, secondary structure can be predicted at significantly increased accuracy. Using a Knowledge Discovery Theory based on the Inner Cognitive Mechanism (KDTICM) method, we have proposed a compound pyramid model, which is composed of three layers of intelligent interface that integrate a mixed-modal SVM (MMS) module, a modified Knowledge Discovery in Databases (KDD1) process, a mixed-modal back propagation neural network (MMBP) module and so on.Testing against data sets of non-redundant protein sequences returned values for the Q3 accuracy measure that ranged from 84.0% to 85.6%,while values for the SOV99 segment overlap measure ranged from 79.8% to 80.6%. When compared using a blind test dataset from the CASP8 meeting against currently available secondary structure prediction methods, our new approach shows superior accuracy.Availability: http://www.kdd.ustb.edu.cn/protein_Web/.  相似文献   

14.
A method is presented for predicting the secondary structure of globular proteins from their amino acid sequence. It is based on a rigorous statistical exploitation of the well-known biological fact that the amino acid compositions of each secondary structure are different. We also propose an evaluation process that allows us to estimate the capacity of a method to predict the secondary structure of a new protein which does not have any homologous proteins whose structure is already known. This evaluation process shows that our method has a prediction accuracy of 58.7% over three states for the 62 proteins of the Kabsch and Sander (1983a) data bank. This result is better than that obtained by the most widely used methods--Lim (1974), Chou and Fasman (1978) and Garnier et al. (1978)--and also than that obtained by a recent method based on local homologies (Levin et al., 1986). Our prediction method is very simple and may be implemented on any microcomputer and even on programmable pocket calculators. A simple Pascal implementation of the method prediction algorithm is given. The interpretation of our results in terms of protein folding and directions for further work are discussed.  相似文献   

15.
介绍了构造性机器学习方法——覆盖算法在蛋白质二级结构预测中的应用。相比普通的神经网络,这种方法直观且运算简单,对训练样本可100%识别。同时,考虑到同源家族的结构应该比单条序列结构预测更准确,采用了基于概率的Profile编码方式,相比以往的预测方法,具有更好的稳定性和精确性。  相似文献   

16.
从氨基酸序列来预测蛋白质二级结构,是我们理解蛋白质结构和功能的重要一步.本文探讨了基于Spiking神经网络的蛋白质二级结构学习预测模型,利用单个神经网络进行学习取得的效果不明显,而利用级联神经网络,通过结构到结构的学习,能很好地提高学习准确率.  相似文献   

17.
从氨基酸序列来预测蛋白质二级结构,是我们理解蛋白质结构和功能的重要一步。本文探讨了基于Spiking神经网络的蛋白质二级结构学习预测模型,利用单个神经网络进行学习取得的效果不明显,而利用级联神经网络,通过结构到结构的学习,能很好地提高学习准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号