首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
为了从蛋白质结构数据库中提取经验知识,进行蛋白质作用位点预测,提出了以蛋白质序列谱作为特征向量,采用支持向量机算法进行训练和预测蛋白质相互作用位点的方法。从蛋白质一级序列出发,以序列上邻近残基的序列谱为输入特征向量,采用支持向量机方法构建预测器,来预测蛋白质相互作用位点,预测精度达到70.47%,相关系数CC=0.1919。实验结果表明,利用蛋白质序列谱,结合支持向量机算法进行蛋白质相互作用位点预测的方法是有效的。  相似文献   

2.
支持向量机有许多优点:有效防止过拟和,适合大的特征空间,给定数据集的信息压缩。本文首次利用支持向量机从氨基酸组成来预测蛋白质的稳定性。总预测率可以达到80.64%,对嗜热蛋白质的预测率为82.50%,对嗜温蛋白质的预测率为80.29%从预测率可以验证氨基酸组成与蛋白质热稳定性成正相关的关系,支持向量机可以成为基于氨基酸组成预测蛋白质热稳定性的有效工具。  相似文献   

3.
在远同源检测的蛋白质结构预测方法中,基于支持向量机的方法取得了优于其他方法的高准确性,但这类方法只能完成对目标蛋白质作出是否属于特定蛋白质结构的判别,而实际应用中常需要直接给出具体的结构预测结果.提出一种基于多类支持向量机的蛋白质结构预测方法,通过采用加权一对多的多类分类方法对标准支持向量机输出结果进行综合评价,获得唯...  相似文献   

4.
编码方式是影响蛋白质二级结构预测准确率的重要因素之一。针对单序列蛋白质二级结构预测问题,提出了一种新的综合编码方法。该编码是根据氨基酸出现在每种二级结构中的倾向因子以及氨基酸的疏水性值进行分类,并以二进制形式来表示每类氨基酸的编码方法。在相同的实验条件下,首先用不同的编码方式对数据集CB513进行编码,然后采用支持向量机的方法进行训练建模预测。实验结果显示提出编码的预测准确率比20位正交编码和5位编码分别高出1.48%和10.68%。可见,该编码比较适合非同源或低同源蛋白质结构预测。  相似文献   

5.
基于SVM的混沌时间序列分析   总被引:1,自引:0,他引:1  
支持向量机是一种基于统计学习理论的新的机器学习方法,该方法已用于解决模式分类问题.本文将支持向量机(SVM)用于混沌时间序列分析,实验数据采用典型地Mackey-Glass混沌时间序列,先对混沌时间序列进行支持向量回归实验;然后采用局域法多步预报模型,利用支持向量机对混沌时间序列进行预测.仿真实验表明,利用支持向量机可以较准确地预测混沌时间序列的变化趋势.  相似文献   

6.
为了提高蛋白质氧链糖基化位点的预测准确率,提出了把独立成分分析和支持向量机相结合的方法。实验样本(蛋白质序列)用稀疏编码方式编码,窗口长度为w=21,对于训练样本和待测样本,首先用独立成分分析法(ICA)提取了120个独立成分(特征),把这些独立成分作为支持向量机的输入,在特征空间用支持向量机(SVM)进行预测(分类)。实验结果表明,ICA+SVM的方法比PCA+SVM和SVM的好。预测准确率为88%。更进一步,用同一个蛋白质序列在不同窗口长度下的样本做实验,结果表明,窗口长度越长,预测准确率越高。  相似文献   

7.
在生物信息学中,对给定氨基酸序列的蛋白质进行分类,检测细微的蛋白质序列相似性或远同源性对于准确预测蛋白质功能和结构都非常重要。提出一种新的基于半监督支持向量机的远同源性检测方法,通过定义序列概率剖面,充分利用大型数据库的非标记数据,并行构筑支持向量机核函数,并结合最近邻分类器实现对任何数据的全覆盖。实验表明,该方法能够大幅提高蛋白质序列分类器的性能与效率。使用并行技术将总体计算时间控制在一定范围,推动了半监督支持向量机分类器的广泛应用。  相似文献   

8.
蛋白质的功能常体现在生物大分子的相互作用中,识别蛋白质相互作用位点对于研究蛋白质功能发挥着重要作用。蛋白质间主要通过表面残基发生相互作用,蛋白质相互作用形成复合体时,只有部分表面残基参与了该过程。基于序列谱信息,提取序列上相邻残基的序列谱作为输入特征向量,对大小为3和7的残基信息窗(win3,win7),分别采用支持向量机(SVM)分类器对蛋白质相互作用位点进行预测、比较和分析。最终实验结果为:win3的平均正确率为69.31%,win7的平均正确率为69.68%。  相似文献   

9.
张寓  於东军 《计算机应用》2019,39(11):3146-3150
为了提高预测腺嘌呤核苷三磷酸(ATP)绑定位点的准确率,提出了一种基于一维卷积神经网络(1D-CNN)的方法。首先,以蛋白质的序列信息为基础,融合位置特异性得分矩阵信息、二级结构信息和水溶性信息,使用随机下采样的方法消除数据不平衡的影响,再对缺失的特征进行再编码补齐,得到训练特征。训练一个1D-CNN来预测蛋白质-ATP绑定位点,优化网络结构,并且进行实验来对比所提方法和其他机器学习方法的优劣。实验结果展示了所提方法的有效性,并且该方法与传统支持向量机(SVM)相比在AUC指标上有部分的提升。  相似文献   

10.
生物信息学的一个关键的研究课题是理解细胞的分子机制,这依赖于对基因所决定的每一条蛋白质的含义或者功能的理解.一般通过与一条或多条功能已知的蛋白质的相似性比较来推测未知蛋白质的功能,其中,基于支持向量机的一些算法取得了很好的成果.SVM-pairwise算法是当前最好的基于支持向量机的算法中的一个,该方法利用两条序列的相似性来将蛋白质序列转化为固定长度的向量.文中提出了一种新的利用支持向量机算法对蛋白质序列进行分类的方法,这种方法使用位点进化距离代替两条序列的比对得分,该方法比SVM-pairwise有着显著的改善,在蛋白质结构分类数据库(SCOP)上进行的实验表明,该方法具有比SVM-pairwise更好的分类性能.  相似文献   

11.
支持向量机是一种比较新的机器学习方法,它满足结构风险最小的要求,并且能够适用于高维的特征空间,因此在生物序列分析中得到了广泛地应用。结合基因序列的特点,提出了一种新的核函数--位置权重子序列核函数。这个核函数融合了基因序列中子序列的组成特征和位置信息,能够比较充分地体现序列特征。将这个核函数用于基因剪接位点的识别分析,得到的结果表明,采用了位置权重子序列核函数的支持向量机能够很好的识别剪接位点,与其它方法相比,取得了更高的识别精度。  相似文献   

12.
Protein-RNA interactions play significant roles in a number of biological activities, such as protein synthesis, regulation of gene expression. Here we propose a hybrid RISP (RNA-interaction site prediction) method, using support vector machine (SVM) in conjunction with evolutionary information of amino acid sequences in terms of their position-specific scoring matrices (PSSMs) for prediction of RNA-binding sites. The results show that our RISP method has 72.2% net prediction (NP) (61.0% sensitivity and 83.3% specificity). When compared with previous studies, this novel method appears more accurate and better generalization abilities. RISP is freely available at http://grc.seu.edu.cn/RISP. Given a protein sequence, RISP decides whether residue in the protein is RNA-binding or not (optimal prediction), and gives the confidence value, 'high specificity' prediction and 'high sensitivity' prediction.  相似文献   

13.
膜蛋白在细胞生命活动中扮演着重要的角色。目前,有很多方法用来预测和分类膜转运蛋白。然而,预测膜蛋白功能的工作并不多。为了解决这个问题,基于蛋白质序列信息结合快速傅里叶变换利用支持向量机的方法预测来自TCDB 数据库中的channels/pores,electrochemical potential-driven transporters和primary active transporters三类膜转运蛋白共1 817条蛋白质的功能。模型使用20种氨基酸的分布,残基的疏水性、平均极性和溶剂化自由能为原始的特征数据,利用快速傅里叶变换将其转化为频域上的信息作为机器学习的特征输入。通过五倍交叉检验预测准确率达到了72.1%,而先前的文献报道的准确率为68.1%。论文的研究证明该方法可以有效地对channels/pores,electrochemical potential-driven transporters和primary active transporters 三种不同功能的膜转运蛋白进行功能分类。  相似文献   

14.
This paper presents a novel framework for anomaly event detection and localization in crowded scenes. For anomaly detection, one-class support vector machine with Bayesian derivation is applied to detect unusual events. We also propose a novel event representation, called subsequence, which refers to a time series of spatial windows in proximity. Unlike recent works encoded an event with a 3D bounding box which may contain irrelevant information, e.g. background, a subsequence can concisely capture the unstructured property of an event. To efficiently locate anomalous subsequences in a video space, we propose the maximum subsequence search. The proposed search algorithm integrates local anomaly scores into a global consistent detection so that the start and end of an abnormal event can be determined under false and missing detections. Experimental results on two public datasets show that our method is robust to the illumination change and achieve at least 80% localization rate which approximately doubles the accuracy of recent works. This study concludes that anomaly localization is crucial in finding abnormal events.  相似文献   

15.
介绍了支持向量机,报告了支持向量机增量学习算法的研究现状,分析了支持向量集在加入新样本后支持向量和非支持向量的转化情况.针对淘汰机制效率不高的问题,提出了一种改进的SVM增量学习淘汰算法--二次淘汰算法.该算法经过两次有效的淘汰,对分类无用的样本进行舍弃,使得新的增量训练在淘汰后的有效数据集进行,而无需在复杂难处理的整个训练数据集中进行,从而显著减少了后继训练时间.理论分析和实验结果表明,该算法能在保证分类精度的同时有效地提高训练速度.  相似文献   

16.
The annotation of proteins can be achieved by classifying the protein of interest into a certain known protein family to induce its functional and structural features. This paper presents a new method for classifying protein sequences based upon the hydropathy blocks occurring in protein sequences. First, a fixed-dimensional feature vector is generated for each protein sequence using the frequency of the hydropathy blocks occurring in the sequence. Then, the support vector machine (SVM) classifier is utilized to classify the protein sequences into the known protein families. The experimental results have shown that the proteins belonging to the same family or subfamily can be identified using features generated from the hydropathy blocks.  相似文献   

17.
为缩小图像的低层特征与高层语义之间的语义鸿沟,基于支持向量机的相关反馈机制受到越来越广泛的关注,但这种方法并没有利用未标记样本的隐含信息.为更好地利用这些信息,提出将直推式支持向量机作为反馈过程中的学习算法.通过分析其所用特征向量的特点,设计一种颜色稀疏特征,并将其与纹理特征结合作为图像描述的特征.实验结果表明该方法较令人满意,同时也说明直推式支持向量机可在文本分类以外的领域取得较好结果.  相似文献   

18.
Prediction of protein structural classes by support vector machines   总被引:14,自引:0,他引:14  
In this paper, we apply a new machine learning method which is called support vector machine to approach the prediction of protein structural class. The support vector machine method is performed based on the database derived from SCOP which is based upon domains of known structure and the evolutionary relationships and the principles that govern their 3D structure. As a result, high rates of both self-consistency and jackknife test are obtained. This indicates that the structural class of a protein inconsiderably correlated with its amino and composition, and the support vector machine can be referred as a powerful computational tool for predicting the structural classes of proteins.  相似文献   

19.
基于闭合有间隔频繁子序列的点击流聚类   总被引:2,自引:0,他引:2       下载免费PDF全文
马超  沈微 《计算机工程》2010,36(23):72-75
对网站日志文件中记录的点击流序列聚类可以发现用户使用模式,从而对用户归类。而传统聚类方法面临着难以提取点击流中有代表性的特征向量以及点击流及其特征向量存在数据稀疏性的问题。针对上述情况,提出一种基于闭合有间隔频繁子序列模式挖掘的点击流聚类方法。该方法从点击流中提取子序列模式的频繁支持度,构建特征向量,利用基于双向映射欧氏距离的模糊距离度量判断向量间相似度,增强BIRCH聚类算法对点击流数据的聚类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号