首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 328 毫秒
1.
从序列出发预测水解酶亚家族类型具有重要意义.本文利用不同标度的伪氨基酸组成提取序列特征值,采用k-近邻算法预测水解酶亚家族类型.选择参数后,三种方法各自在最优运行参数下预测水解酶亚家族的准确率分别为:85.15%,82.65%和80.14%.其中以Z标度的伪氨基酸组成效果最佳,比氨基酸组成识别精度提高12.85%.本文研究结果说明从序列出发,预测水解酶亚家族是可行的,且修正的伪氨基酸组成可望成为一种新的有效提取蛋白质序列特征值的方法.  相似文献   

2.
利用生物信息学快速准确鉴别酶、非酶蛋白及内含肽能极大提高实验效率,而测序数量的指数型增长使酶、非酶蛋白及内含肽的自动分类尤显重要。本文获取了同一性小于25%的序列共计3853条,采用Z标度的伪氨基酸组成和氨基酸组成分布提取序列特征值识别酶、非酶蛋白及内含肽。结果表明,该特征值提取方法经参数优化后,即当λ=5,w=0.15时,以支持向量机为分类器,其10倍交叉验证的精度可达81.3%,ROC曲线下面积为0.83;其精度高于其它方法0.5%到12.9%不等;独立样本测试的预测精度可达71.2%,ROC曲线下面积为0.782,其精度高于其它方法0.4%到6.4%不等,效果均优于其它常见的序列特征值方法。本文结果说明从序列出发判断其归属是可行的,3种不同功能的分子在序列特征上存在一定的差异,所建立的Z标度的伪氨基酸组成和氨基酸组成分布法可用于其它类似的生物信息学问题。建立了从序列出发预测酶、非酶蛋白及内含肽的新方法。  相似文献   

3.
使用伪氨基酸和集成分类器预测凋谢蛋白亚细胞定位   总被引:1,自引:1,他引:0  
预测凋谢蛋白质亚细胞定位是生物信息学和蛋白质科学中重要的研究内容.基于Chou的伪氨基酸组成概念,用近似熵表示蛋白质序列的附加特征,组成新的伪氨基酸组成表示序列特征.将蛋白质序列看作短时间序列,近似熵能够区分不同亚细胞定位中序列的复杂度.结合多个模糊K近邻分类器(基本分类器)的集成分类器作为预测工具.以不同维数的伪氨基酸组成向量,作为每个基本分类器的输入数据.3个常用的数据集用来测试算法的性能,Jackknife测试结果表明新算法有效和实用.有望发展成为亚细胞定位研究的有用工具.  相似文献   

4.
为了提高下肢表面肌电信号步态识别的准确性,提出了一种基于遗传算法(GA)优化的BP神经网络分类器设计方法。首先,对采集的下肢表面肌电信号进行小波滤波及特征值提取,其次,构造基于GA优化的BP神经网络分类器,然后,以提取的表面肌电信号特征作为输入对分类器进行训练,最后利用训练好的分类器进行测试。实验结果表明,基于GA优化的BP神经网络分类器能成功识别下肢正常行走的五个步态,平均识别率达到98%以上,效果明显优于BP神经网络分类器的识别效果。  相似文献   

5.
应用非线性最小二乘支持向量机对原核生物进行基因识别,通过寻找序列开放阅读框(ORF),并与可靠基因位点文件进行比较产生训练样本集,然后提取样本GC含量和Z曲线特征,并利用T检验方法检验各特征值所包含的信息量,设计出了非线性最小二乘支持向量机分类器识别基因.结果表明非线性最小二乘支持向量机的识别率比Fisher判别和线性支持向量机在不同的特征组合下分别提高了7.09%~29.97%和10.97%~25.45%,并且在特征值信息量较小的情况下非线性最小二乘支持向量机更能表现其优越性.  相似文献   

6.
文章处理的是中国民族乐器的识别分类问题.提出了一种基于合适的音频特征值选择方法,该方法在基于MPEG_7标准的声学特征,在特征值的时间特性上进行改造,并加入改进后的特征值.从提取的音频特征值数据集选择K-最近邻算法.特别是对没有加入新特征值和加入新特征值后生成分类器模型的性能进行了比较.实验结果证明新特征值的加入提高了分类器的F1度量值.  相似文献   

7.
黄铃  李学明 《计算机应用》2013,33(12):3563-3566
针对微博上存在的大量垃圾评论,提出一种基于AdaBoost的微博垃圾评论识别方法。该方法首先提取表示微博评论的特征值向量,由8个特征值组成,然后通过AdaBoost算法在这些特征上训练出若干个比随机预测好的弱分类器,最后将得到的弱分类器加权集合成高精度的强分类器。从实际的热门新浪微博中提取评论数据集进行实验,结果表明所选取的8个特征是有效的,该方法对于微博垃圾评论的识别拥有较高的识别率。  相似文献   

8.
氨基酸序列的特征描述   总被引:2,自引:4,他引:2  
氨基酸序列的特征描述是指从一条氨基酸序列选取相关的特征信息并用数学方法描述这些信息,使之能正确反映序列与结构或功能之间的关系。在根据氨基酸序列预测蛋白质的结构类或亚细胞位置等问题中,氨基酸序列的特征描述直接影响预测质量;同时比较不同描述方法对预测结果的影响可以帮助我们理解序列与结构或序列与功能之间的关系。本文介绍了几种氨基酸序列的特征描述方法,以FDOD方程作为判别函数,比较了其中几种描述方法对蛋白质结构类预测结果的影响,发现二级结构单纯的全α类和全β类蛋白质对于氨基酸组成比较敏感,而对于混合型蛋白质,即α β类和α/β类蛋白质,考虑氨基酸残基排列顺序可以显著提高预测结果。  相似文献   

9.
针对工地进出口的视频监控录像,考虑远距离低分辨率安全帽识别问题,探讨了低分辨率安全帽识别方法,分析了提取不同的特征和应用不同的分类器与识别率的关系.首先截取视频中的人头,获得大小为22*22的图像,然后分别提取图像的统计特征、局部二进制模式特征、快速主成分分析特征,再利用分类器和反向人工神经网络进行分类预测,最后计算测试样本的识别率.实验结果表明,提取图像的二进制模式统计特征,再结合反向人工神经网络的识别率效果最佳,识别率可达87.27%.  相似文献   

10.
可穿戴设备的人体行为识别研究通常是提取传感器数据的特征值,然后结合分类算法识别人体行为动作。针对特征提取与分类器问题,提出一种融合模型的人体行为识别方法(HBRM)。首先将加速度传感器采集的数据转换为二维张量格式,然后结合卷积神经网络(CNN)提取张量的特征,同时考虑到人体行为动作在时间序列上前后具有较强的关联性,提出利用长短期记忆(LSTM)网络进行人体行为动作的识别。由于卷积神经网络在特征提取方面具有较好的性能,且长短期记忆模型擅长处理时间序列问题,因此将这两种模型进行融合理论上具有较好的效果。在WISDM数据集上进行实验,结果表明:该方法对六种人体行为动作的平均识别率达到了96.95%。  相似文献   

11.
氨基酸含量是影响蛋白质耐热性的主要因素。本文以氨基酸含量为特征向量,研究了贝叶斯方法预测蛋白质耐热性的准确度。结果表明,基于贝叶斯方法的局部预测率和全局预测率分别为73.1%和76.1%。这不仅表明贝叶斯方法适合于蛋白质耐热性的分类,而且也证明了氨基酸含量的确对蛋白质耐热性有重要作用。  相似文献   

12.
提出了两层混合分类器来预测蛋白质半胱氨酸氧化还原状态,第一层总体线性分类器利用氨基酸百分含量作为输入信息,第二层局部SVM分类器利用半胱氨酸周围局部序列作为输入信息。以2002年4月份的PISCES culled PDB数据库中的 639条蛋白质多肽链作为研究对象,共含有584条二硫键,2 904个半胱氨酸。经严格的折叠刀方法检验,预测半胱氨酸的氧化还原状态准确率最高可达84.1%(半胱氨酸水平)和80.1%(蛋白质水平)。结果表明这种将蛋白质总体信息与局部上下文序列信息结合起来构建的两层混和分类器具有较高的预测准确率。研究结果也表明总体氨基酸百分含量和半胱氨酸周围局部序列都携带有二硫键形成的相关信息,暗示了半胱氨酸是否形成二硫键不但取决于蛋白质全局的结构信息同时也受到局部序列信息的影响。  相似文献   

13.
Prediction of protein structural class plays an important role in protein structure and function analysis, drug design and many other biological applications. Prediction of protein structural class for low-similarity sequences is still a challenging task. Based on the theory of wavelet denoising, this paper presents a novel method of prediction of protein structural class for the first time. Firstly, the features of the protein sequence are extracted by using Chou’s pseudo amino acid composition (PseAAC). Then the extracted feature information is denoised by two-dimensional (2D) wavelet. Finally, the optimal feature vectors are input to support vector machine (SVM) classifier to predict protein structural classes. We obtained significant predictive results using jackknife test on three low-similarity protein structural class datasets 25PDB, 1189 and 640, and compared our method with previous methods The results indicate that the method proposed in this paper can effectively improve the prediction accuracy of protein structural class, which will be a reliable tool for prediction of protein structural class, especially for low-similarity sequences.  相似文献   

14.
以氨基酸含量为特征向量,研究了SVM和KNN预测蛋白质耐热性的准确度。结果表明,基于SVM的分类效果较好,其局部预测率和全局预测率分别为82.4%和83.4%;而基于KNN方法的局部预测率和全局预测率分别为77.6%和79.9%。两种方法的预测率均表明氨基酸含量是影响蛋白质耐热性的主要因素。  相似文献   

15.
传统的预测方法在构造特征向量时只考虑了氨基酸的组成,而自相关系数不仅能够很好地反映序列中氨基酸的位置信息,而且考虑了序列内部不同位置的氨基酸间的相互影响。设计了一种将氨基酸组成和自相关系数相结合的方法来构造特征向量;在Chou提出的伪氨基酸组成模型(pseudo.aminoacidcomposition,PseAAC)的基础上,通过扩展信息重新构造了伪氨基酸组成模型,并将其与自相关系数组合在一起来构造特征向量。分别使用两种方法编码,选用支持向量机作为预测工具,在数据集Z277、Z498以及独立测试集D138上进行了若干实验,对比结果显示,新方法比传统的氨基酸组成方法的准确率分别平均提高了7.43%和8.53%,证明了新方法是有效的。  相似文献   

16.
针对医学疾病数据中存在特征冗余的问题,以XGBoost特征选择方法度量特征重要度,删除冗余特征,选择最佳分类特征;针对识别精度不高的问题,使用Stacking方法集成XGBoost、LightGBM等多种异质分类器,并在异质分类器中引入性能更好的CatBoost分类器提升集成分类器分类精度。为了避免过拟合,选择基层分类器输出的分类概率作为高层分类器输入。实验结果表明,提出的基于XGBoost特征选择的XLC-Stacking方法相比当前主流分类算法以及单一的XGBoost算法和Stacking方法有较大提升,识别的准确率和F1-Score达到97.73%和98.21%,更加适用于疾病的诊断。  相似文献   

17.
蛋白质棕榈酰化是一种可逆的蛋白质翻译后修饰,在蛋白质稳定性和亚细胞定位等方面发挥重要作用。构建了一种预测蛋白质棕榈酰化位点的新模型(PSSM-CKSAAP-RFE)。采用蕴含进化信息的[k]-spaced氨基酸对组分方法表征蛋白质序列,通过递归特征消除法进行特征选择;基于上述特征训练支持向量机分类器,并采用夹克刀交叉验证法测试模型性能。研究结果显示,训练集和独立测试集的预测准确率、马修斯相关系数、特异性、敏感性和受试者工作特征曲线下面积分别为98.44%、0.94、98.95%、95.65%和0.990,以及98.41%、0.93、99.39%、92.31%和0.994,优于文献中报道的相关方法,为蛋白质棕榈酰化位点的预测提供了一种新模型。  相似文献   

18.
基于CNN和农作物光谱纹理特征进行作物分布制图   总被引:1,自引:0,他引:1  
以卷积神经网络(Convolutional Neural Network, CNN)为代表的深度学习技术,在农作物遥感分类制图领域具有广阔的应用前景。以多时相Landsat 8 多光谱遥感影像为数据源,搭建CNN模型对农作物进行光谱特征提取与分类,并与支撑向量机(SVM)常规分类方法进行对比。进一步引入影像纹理信息,利用CNN对农作物光谱和纹理特征进行提取,优化作物分布提取结果。实验表明:① 基于光谱特征的农作物分布提取,验证结果对比显示,CNN对应各类别精度、总体精度均优于SVM,其中二者总体精度分别为95.14%和91.77%;② 引入影像纹理信息后,基于光谱和纹理特征的CNN农作物分类总体精度提高至96.43%,Kappa系数0.952,且分类结果的空间分布更为合理,可有效区分花生、道路等精细地物,说明纹理特征可用于识别不同作物。基于光谱和纹理信息的CNN特征提取,可面向种植结构复杂区域实现农作物精准分类与分布制图。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号