首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
为了从蛋白质结构数据库中提取经验知识,进行蛋白质作用位点预测,提出了以蛋白质序列谱作为特征向量,采用支持向量机算法进行训练和预测蛋白质相互作用位点的方法。从蛋白质一级序列出发,以序列上邻近残基的序列谱为输入特征向量,采用支持向量机方法构建预测器,来预测蛋白质相互作用位点,预测精度达到70.47%,相关系数CC=0.1919。实验结果表明,利用蛋白质序列谱,结合支持向量机算法进行蛋白质相互作用位点预测的方法是有效的。  相似文献   

2.
蛋白质的功能常体现在生物大分子的相互作用中,识别蛋白质相互作用位点对于研究蛋白质功能发挥着重要作用。蛋白质间主要通过表面残基发生相互作用,蛋白质相互作用形成复合体时,只有部分表面残基参与了该过程。基于序列谱信息,提取序列上相邻残基的序列谱作为输入特征向量,对大小为3和7的残基信息窗(win3,win7),分别采用支持向量机(SVM)分类器对蛋白质相互作用位点进行预测、比较和分析。最终实验结果为:win3的平均正确率为69.31%,win7的平均正确率为69.68%。  相似文献   

3.
蛋白质的功能常体现在生物大分子的相互作用中,识别蛋白质相互作用位点对于研究蛋白质功能发挥着重要作用.蛋白质问主要通过表面残基发生相互作用,蛋白质相互作用形成复合体时,只有部分表面残基参与了该过程.基于序列谱信息,提取序列上相邻残基的序列谱作为输入特征向量,对大小为3和7的残基信息窗(win3,win7),分别采用支持向量机(SVM)分类器对蛋白质相互作用位点进行预测、比较和分析.最终实验结果为:win3的平均正确率为69.31%,win7的平均正确率为69.68%.  相似文献   

4.
蛋白质相瓦作用位点在细胞进程中有着非常重要的作用.尽管利用高通量方法发现蛋白质相瓦作用位点取得很大的成功,仍需要计算方法辅助预测实验中的相互作用位点.本文提出了基于残基序列谱、进化率和疏水性的预测异源蛋白质复合物作用位点的两种向量表示方法并以支持向量机实现预测.其中,提出新的向量表示法取得更好的预测性能.文中的数据集由66个异源复合物蛋白质链组成.  相似文献   

5.
杜秀全  程家兴  宋杰 《计算机工程》2010,36(18):203-204
蛋白质相互作用位点的预测是当前生物信息学的一个研究热点。针对蛋白质序列中对界面残基有影响的各种因素,提出将蛋白质的进化信息和保守性作为特征函数,此类信息体现了蛋白质序列中氨基酸之间短程和长程相互作用的影响。采用最大熵模型作为蛋白质作用位点识别的分类器,将多源信息融合成一个概率模型。实验结果表明该方法与其他传统机器学习方法相比,在特异度和精度上分别提高了2%~8%、3%~11%,且获得了较高的相关系数。  相似文献   

6.
考虑到现有的基于序列的蛋白质相互作用预测方法均采用单一的特征提取方法,具有一定的局限性,提出一种方法。用元学习策略作为分类器融合策略,并集成多种蛋白质序列特征提取方法。在10 702对酿酒酵母蛋白质对数据集上,得到97.28%的预测精度,优于目前现有方法的平均水平,在独立测试集上同样具有优秀的表现,实验结果表明,该方法有效提高了蛋白质相互作用预测的准确率。  相似文献   

7.
蛋白质相互作用位点研究在蛋白质功能分析及药物设计等方面有着重要的应用。文章以蛋白质中的氨基酸残基为研究对象,使用残基的溶剂可及表面积、进化保守性打分及残基的序列信息熵三个特征为特征集,构建了基于贝叶斯方法的蛋白质相互作用位点预测的贝叶斯分类预测器。方法有效的结合了蛋白质残基特征数据集经常性数据缺失的特点及贝叶斯网在处理不确定性数据方面的优点,通过对基准的71个蛋白质数据集进行实验,结果表明我们的分类器预测的有效性。  相似文献   

8.
提出了基于SVM的主动学习算法,用来解决蛋白质相互作用的预测问题。细胞中的生物过程是通过蛋白质相互作用实现的。但是通过实验验证蛋白质之间是否具有相互作用的代价非常大,而且数据很难获取。为了在有限的阳性样本情况下更加快速准确地预测蛋白质之间是否具有相互作用,引入了主动学习方法。主动学习算法可以用来构造有效训练集,其目标是通过迭代抽样,每次寻找最富有信息量的数据点,找到最有利于提升分类效果的样本,进而减小分类训练集的大小。比较了5种不同的主动学习算法,以寻找在有限资源前提下提高分类算法效率的最佳途径。实验表明,主动学习方法与SVM算法相结合,能够在保证SVM分类性能的前提下,有效减少学习所需的样本数量。  相似文献   

9.
蛋白质-蛋白质相互在细胞生命过程扮演重要角色,广泛参与免疫反应,信号传导,基因表达,蛋白质合成等,研究蛋白质-蛋白质作用位点,将有助于揭示生命过程的许多本质,对预防、诊断疾病,以及突变设计、蛋白质相互作用网络构建等方面均具有重要的参考价值.根据蛋白质.蛋白质作用位点残摹倾向性及作用位点与其周围临近残基密切相关的特性,本文提出基于序列谱(或空间谱)构建自相关函数,度量邻近残基之间的相关程度,采用AdaB00st分类器预测蛋白质-蛋白质相互作用位点,精度达到67.6%,表明本文的方法预测蛋白质-蛋白质相互作用位点是有效的,为研究蛋白质-蛋白质相互作用位点研究提供了一种新方法.  相似文献   

10.
基于序列模式特征和SVM的剪切位点预测   总被引:1,自引:1,他引:0       下载免费PDF全文
通过对HS3D数据集供点序列碱基的统计分析,利用供体位点邻域碱基出现规律构造模式(motif)作为DNA序列的属性。设置序列属性值将字符序列映射成数字向量,应用支撑向量机进行实验,实现对供体位点的预测分类。实验结果表明,与改进的motif得分模型方法相比,该文方法可有效去除数据中异常数据对分类的影响,将DNA字符序列变换到motif属性数字序列空间具有有效性和实用性。  相似文献   

11.
编码方式是影响蛋白质二级结构预测准确率的重要因素之一。针对单序列蛋白质二级结构预测问题,提出了一种新的综合编码方法。该编码是根据氨基酸出现在每种二级结构中的倾向因子以及氨基酸的疏水性值进行分类,并以二进制形式来表示每类氨基酸的编码方法。在相同的实验条件下,首先用不同的编码方式对数据集CB513进行编码,然后采用支持向量机的方法进行训练建模预测。实验结果显示提出编码的预测准确率比20位正交编码和5位编码分别高出1.48%和10.68%。可见,该编码比较适合非同源或低同源蛋白质结构预测。  相似文献   

12.
由于极端支持向量分类机(ESVM)在对样本进行分类时并没有考虑到数据集中样本点的分布情况,对所有样本点的误差项都给予了相同的惩罚因子,使得分类器的分类效果很容易受到噪声、野值数据的干扰,针对这个问题,在ESVM的基础上提出了一种基于距离加权的极端支持向量机(WESVM)。由于不同的样本到其类中心距离的不同,因此对不同的样本给予不同的权重。分类实验结果表明WESVM与ELM、ESVM相比具有更好的分类精度。  相似文献   

13.
基于多特征融合的图像拼接检测   总被引:2,自引:0,他引:2  
周文兵  李峰  熊兵 《计算机工程与应用》2012,48(21):167-170,177
针对数字图像篡改的常用手法图像拼接,提出了一种基于多特征融合的被动盲取证算法来检测图像拼接.算法通过分析图像相位一致性和纹理特征,采用二维经验模式分解将图像分解到固有模态函数域,得到三类特征值.利用这三类特征值,采用支持向量机作为分类器,建立一个预测模型,对图像是否经过篡改进行判定.选用标准图像拼接库对该算法进行测试.实验结果表明:与采用双相干谱作为分类特征的算法相比,该算法具有更高的识别率.  相似文献   

14.
鲁棒SVR在金融时间序列预测中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
王快妮  钟萍  赵耀红 《计算机工程》2011,37(15):155-157,163
针对标准支持向量机对噪声和异常值比较敏感的问题,通过限定噪声和异常值的损失上界,提出一种基于不对称Ramp损失函数的鲁棒支持向量回归机模型,应用凹凸过程将其由非凸优化问题转化为凸优化问题并利用牛顿法进行求解.对上证指数和香港恒生指数收盘价的预测结果表明,该模型能在一定程度上抑制噪声和异常值的影响,从而提高预测精度及减少...  相似文献   

15.
为从生物医学信号角度检测和评估视觉疲劳,模拟VDT作业环境,对35位健康被试者进行1.5 h的VDT疲劳实验。使用MP425数据采集卡和LabVIEW构成的数据采集系统同步采集心电(ECG)和脉搏波信号,经信号预处理分析后,提取实验前后的ECG和脉搏波信号特征。研究结果表明,ECG和脉搏波信号特征在实验前后有较大变化,采用支持向量机法对实验前后的ECG脉搏组合特征进行分类,正确率可达100%。  相似文献   

16.
混合核函数支持向量机的磨矿粒度预测模型   总被引:1,自引:0,他引:1       下载免费PDF全文
选矿厂磨矿粒度是影响精矿品位和回收率的重要因素。针对目前无法对磨矿粒度进行实时有效检测问题,提出了一种基于支持向量机的磨矿粒度预测模型。通过对现有支持向量机建模方法分析比较,选择了新型的混合核支持向量机作为预测模型的建模工具,同时为了解决有效选择混合核参数问题,提出利用遗传算法对模型结构参数进行优化。仿真结果表明,用该方法建立的磨矿粒度预测模型优于基于RBF核支持向量机建立的该预测模型,其具有较好的逼近性能和泛化性能及更高的预测精度。  相似文献   

17.
在细胞彩色图像处理中,为了有效地计算与分析细胞各特征值,对细胞图像的精确的三域分割是细胞自动分析与识别的一个关键环节。提出利用多分类支持向量机对细胞彩色图像进行背景、胞浆与核的一次性三域分割,并且通过聚类分析的方法实现了在线训练,实验表明,该方法在细胞彩色图像的多域分割上,能获得较高的分割精度和较好的鲁棒性。  相似文献   

18.
改进的概率选择主动支持向量机算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对大多数主动学习支持向量机(ASVM)的主动学习策略只注重考察超平面附近的样本,忽略了有些距离超平面远但是支持向量的样本,而且没有考虑当前超平面是否接近实际的超平面。提出一种基于概率的主动支持向量机算法,采用一个置信因子来衡量当前的超平面接近实际的超平面的程度。实验结果都验证了该算法在分类精度与计算量方面都有了较大改进。  相似文献   

19.
从视觉角度来说,视觉显著性图像是指主体突出的图像,比起内容散乱的图像,此类图像往往更能吸引用户的关注,也更符合用户对图片检索的使用需求。提出了一种图像主体视觉显著性判断方法,采用“中心围绕”计算原则在多特征融合的基础上应用支持向量机训练,建立了一个分类模型,并且可以给出表征图像显著程度的得分。实验表明,该模型有较高的分类正确率,并且将该模型应用于图像检索重排序、图像上传自动审核等应用时,可以得到更接近人工操作的结果,降低人力资源成本。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号