共查询到16条相似文献,搜索用时 78 毫秒
1.
获取真核细胞中细胞核内蛋白质定位的信息对注解蛋白质功能具有非常重要的意义。针对于利用计算方法预测蛋白质在亚核水平上的定位更具挑战性的问题,提出了基于自互协方差变换与递归特征消除预测蛋白质亚核定位的方法。该方法基于位置特异性得分矩阵利用自互协方差变换构建蛋白质序列的特征向量,采用递归特征消除法进行特征选择,选用支持向量机作为预测工具,并在两个经典数据集SC714和LD504上进行了夹克刀测试。实验结果表明,该方法比大多数已报道的预测方法具有更高的预测准确率。 相似文献
2.
蛋白质棕榈酰化是一种可逆的蛋白质翻译后修饰,在蛋白质稳定性和亚细胞定位等方面发挥重要作用。构建了一种预测蛋白质棕榈酰化位点的新模型(PSSM-CKSAAP-RFE)。采用蕴含进化信息的[k]-spaced氨基酸对组分方法表征蛋白质序列,通过递归特征消除法进行特征选择;基于上述特征训练支持向量机分类器,并采用夹克刀交叉验证法测试模型性能。研究结果显示,训练集和独立测试集的预测准确率、马修斯相关系数、特异性、敏感性和受试者工作特征曲线下面积分别为98.44%、0.94、98.95%、95.65%和0.990,以及98.41%、0.93、99.39%、92.31%和0.994,优于文献中报道的相关方法,为蛋白质棕榈酰化位点的预测提供了一种新模型。 相似文献
3.
首先基于特征融合思想,采用氨基酸组成、熵密度和自相关系数结合的方式构建190维特征向量进行特征表达,与仅考虑氨基酸组成信息的传统方法相比,能更好地表达蛋白质结构信息。然后利用LDA(Linear Discriminant Analysis)方法进行降维,降低计算复杂性,加强同类样本间的相关性。接下来选用支持向量机作为分类器进行定位预测,最后采用留一法在Gram-negative和Gram-positive数据集上进行交叉检验。实验结果表明,多特征结合的方法优于传统的氨基酸组成方法和简单的自相关系数方法,证明了新方法的有效性。 相似文献
4.
石大宏 《计算机与数字工程》2015,(6)
蛋白质‐核苷酸绑定位点预测对于蛋白质功能研究和药物设计有极其重要的作用。单纯依赖生物学实验来获取绑定位点情况的成本大,耗时长。因此,使用模式识别的方法来进行蛋白质‐核苷酸预测越来越重要。蛋白质‐核苷酸绑定位点预测是一个典型的不平衡学习问题,为了保持样本的平衡性,在稀疏表示方法提取特征的基础上,使用基于聚类的下采样方法进行采样,然后用SVM进行蛋白质‐核苷酸绑定位点预测。实验结果说明了方法的可行性和有效性。 相似文献
5.
针对超宽带在非视距环境下测距误差大引起定位误差较大的问题,提出了一种基于最小二乘支持向量机支持向量机(Least Squares_Support Vector Machine,LS_SVM)算法的测距误差处理.该方法将室内区域划分为多个相等的小区域,建立每个区域的采样信号的特征值和节点位置的非线性关系,利用LS_SVM对其进行分类和回归进行定位,对于非视距测距结果赋予较小的一个权重.实验仿真表明,相比K邻近算法(K-Nearest Neighbors,K-NN)误差精度在7 cm内提高10%,说明本算法能够有效的提高定位精度. 相似文献
6.
针对传统WLAN指纹定位算法中存在的定位精度低、稳定性差、实时性不高等问题,提出一种基于CMAES-SVR的WLAN室内定位算法。该算法首先对接入点(AP)的接收信号强度(RSS)进行统计分析,采用高斯滤波对信号进行预处理,然后利用k-means聚类算法将原始指纹数据库中的定位区域进行聚类分块;其次采用协方差矩阵自适应进化策略(CMAES)优化支持向量回归机(SVR)参数,从而建立CMAES-SVR室内定位学习模型,通过该模型分别构建各定位子区域中RSS信号与物理位置非线性映射关系;最后判断测试点所属类簇,根据该类簇中训练好的CMAES-SVR模型进行回归预测。实验结果表明,与WKNN、传统SVR以及PSO-SVR算法相比,该算法在定位精度、稳定性以及实时性方面均有所提高。 相似文献
7.
正确地识别蛋白质-二磷酸鸟苷(Guanosine Diphosphate,GDP)绑定位点对于蛋白质功能分析和药物设计有非常重要的意义。蛋白质-GDP绑定位点预测是一个典型的不平衡学习问题。直接应用传统的机器学习方法是不合适的,而且会使预测结果偏向大多数类。为了解决这个问题,在基于稀疏表示的位置特异性得分矩阵特征基础上,提出了加权下采样方法来使得样本平衡,采用支持向量机算法来预测。实验结果表明提出的方法能获得更高的预测性能。 相似文献
8.
由于传统的支持向量机(SVM)算法的核函数没有考虑训练数据自身的特点,因而相对于具体的问题来说,往往不是最优的。为了获得最优的分类结果,提出了一种基于核变换思想的支持向量机分类方法。该方法首先根据训练样本的类属信息,通过对初始核进行线性变换来间接地达到改进输入空间到输出空间的映射函数的目的,同时利用变换后的核函数来求解分类数据特征空间的超平面方程。仿真和实验结果表明,采用此方法,不仅可以提高系统的分类性能和降低噪声的干扰,而且可以增强分类结果的鲁棒性。 相似文献
9.
高超声速进气道不起动预测研究中主要包括确定压力传感器位置和建立起动不起动分类面,属于机器学习中特征选择问题和分类问题,而常用特征选择算法(基于支持向量机的递归特征消除SVM-RFE)单一并且耗时较长。为解决该问题寻找较优的特征选择算法,建立一个高超声速二元进气道/隔离段模型,通过数值模拟获得内流道上表面压力数据样本;利用Relief和SVMRFE组合式算法Relief-Corre方法,Relief-SVMRFE方法,Relief-PSO-SVMRFE方法进行特征选择;支持向量机SVM训练分类面。最后得出Relief-SVMRFE方法性能最优,运行效率比SVMRFE提高了约3倍,准确率比其他基于Relief组合方法高;获得最优特征的分类面具有较高的泛化性与鲁棒性,证明该分类面的有效性。 相似文献
10.
11.
考虑到现有的基于序列的蛋白质相互作用预测方法均采用单一的特征提取方法,具有一定的局限性,提出一种方法。用元学习策略作为分类器融合策略,并集成多种蛋白质序列特征提取方法。在10 702对酿酒酵母蛋白质对数据集上,得到97.28%的预测精度,优于目前现有方法的平均水平,在独立测试集上同样具有优秀的表现,实验结果表明,该方法有效提高了蛋白质相互作用预测的准确率。 相似文献
12.
提出了一种基于改进遗传算法的特征选择算法。该算法以支持向量机分类器的识别率作为特征选择的可分性判据,对传统遗传算法的交叉和选择操作进行了改进,实现了指定数目的特征选择。而且算法在特征选择的过程中,还同时优化了支持向量机分类器的两个参数。实验数据的特征选择实验表明,提出的算法仅以损失2.7%识别率的代价,得到的特征维数却是传统遗传算法的1/5,极大地简化了分类器设计的复杂度。 相似文献
13.
针对目前脑机接口中提取明显的脑电信号特征较难以及特征维数较多的缺陷,提出了一种多参数的公共空间频率模式CSSP(Common Spatio-Spectral Pattern)算法对脑电信号进行特征提取。该算法对不同通道的脑电信号采取不同的延时因子,增强了CSSP算法在频域上的滤波效果。在对2003年国际脑机接口BCI(Brain Computer Interface)竞赛的运动想象脑电识别中,利用多参数CSSP特征提取方法结合支持向量机SVM(Support Vector Machine)分类方法,在只提取两维特征的情况下,较公共空间模式CSP(Common Spatial Pattern)与CSSP算法,分类的正确率有了明显提高。同时,多参数的引入使该方法在特征提取上较CSP与CSSP算法具有更强的适用性。 相似文献
14.
提出了一种基于小波变换和多类支持向量机的图像分类新方法,该方法利用小波变换进行图像特征提取,利用多类支持向量机进行图像分类,并与基于图像底层特征的图像分类方法进行了实验比较。实验结果表明该方法具有较好的分类性能。 相似文献
15.
基于特征加权的支持向量回归机研究 总被引:3,自引:0,他引:3
基于统计学习理论的支持向量回归机有比较好的泛化能力,然而当样本含有与该问题不完全相关甚至完全无关的特征时,会使得各个特征对问题的相关程度差异很大,从而使得支持向量回归机的效果受到影响。为了解决这个问题,提出了一种基于特征加权的支持向量回归机。模拟的计算结果显示出此方法的有效性。 相似文献
16.
针对二叉树支持向量机多分类算法准确率与分类效率较低的问题,提出了一种基于加权模糊隶属度的二叉树支持向量机多分类算法(binary tree support vector machines multi-classification algorithm based on weighted fuzzy membership,PF-BTSVM)。该算法依据最大最小样本距离与质心距离构造出一个近似完全二叉树,提高了整体结构的分类效率;利用模糊隶属度函数以及正负辅助惩罚因子对训练集进行筛选,剔除掉对分类无用的样本与噪声值,实现了训练集的提纯并且削弱了不平衡分类时超平面的偏移。在数据集上的实验结果表明,与其他二叉树多分类算法相比,该算法在提高了分类准确率以及稳定性的的同时还加快了训练与分类的速度,而且这种优势当分类的不平衡度越大时越明显。 相似文献