首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
支持向量机有许多优点:有效防止过拟和,适合大的特征空间,给定数据集的信息压缩。本文首次利用支持向量机从氨基酸组成来预测蛋白质的稳定性。总预测率可以达到80.64%,对嗜热蛋白质的预测率为82.50%,对嗜温蛋白质的预测率为80.29%从预测率可以验证氨基酸组成与蛋白质热稳定性成正相关的关系,支持向量机可以成为基于氨基酸组成预测蛋白质热稳定性的有效工具。  相似文献   

2.
基于氨基酸组成预测蛋白质热稳定性的v-支持向量机方法   总被引:2,自引:2,他引:0  
支持向量机有许多优点有效防止过拟和,适合大的特征空间,给定数据集的信息压缩.本文首次利用支持向量机从氨基酸组成来预测蛋白质的稳定性.总预测率可以达到80.64%,对嗜热蛋白质的预测率为82.50%,对嗜温蛋白质的预测率为80.29%从预测率可以验证氨基酸组成与蛋白质热稳定性成正相关的关系,支持向量机可以成为基于氨基酸组成预测蛋白质热稳定性的有效工具.  相似文献   

3.
为了提高企业财务困境预测的正确率,减少训练模型的样本数和训练时间,在传统支持向量机预测模型的基础上,将Renyi熵和最小二乘支持向量机算法应用于财务困境预测,提出了一种基于Renyi熵的最小二乘支持向量机预测模型.独立推导出了适合财务困境预测这一离散序列的熵以及支持向量机核函数的表达式,同时,给出了这一改进算法的实现步骤.实验结果表明,该算法无论是训练样本的数量还是训练时间,都显著优于传统的最小二乘支持向量机以及标准支持向量机预测模型.  相似文献   

4.
严亚  张牧  田慧欣 《计算机应用》2014,(Z2):176-179,223
针对钢铁企业中高炉煤气( BFG)受入量难以有效预测的问题,提出了一种基于数据滤波的组合预测模型。首先,采用经验模态分解( EMD)法将原始训练数据分解为相互独立的固有模态函数,根据各模态函数自相关函数的特点滤去噪声分量,采用滤波后的重构序列作为训练样本;然后,采用组合的支持向量机( SVM)模型对受入量进行预测,并利用遗传算法( GA)对支持向量机的参数进行优化;最后,利用现场实际数据验证该模型的预测精度,并与传统预测方法相比较,三组预测的平均绝对百分误差分别为3.22'、4.43'和5.23'。结果表明该方法对高炉煤气受入量的预测具有较高精度,为煤气管网的平衡调度提供了决策支持。  相似文献   

5.
为了实现无创血糖浓度检测,提出了基于支持向量机回归模型的无创血糖光谱算法. 该算法使用光电容积脉搏波(PPG)设备对志愿者指端红光、红外光交替采样得到PPG信号,然后通过微创血糖仪测得血糖浓度. 对采集到的PPG信号进行处理提取特征组成特征矩阵,分别运用不同机器学习模型对特征矩阵和实时血糖浓度进行回归训练,得到特征矩阵与血糖浓度间的关系,并对训练得到的函数关系进行验证,选取出高斯核支持向量机模型为最佳训练模型. 实验证明,与偏最小二乘回归进行对比,本文提出的运用核函数为高斯核的支持向量机算法的预测准确度能提升10%~15%,预测的高低血糖正确率达到98%.  相似文献   

6.
支持向量机作为统计学习理论中的新内容,在小样本条件下具有良好的学习性能。本文以进程调度序列作为审计数据,利用支持向量机实现网络入侵检测,对有限样本进行训练,对未知样本进行检测,并研究核函数、训练样本数量对检测正确率的影响。实验仿真表明,该方法具有较高的检测正确率。  相似文献   

7.
对含有噪声的数据序列根据预测置信度进行去噪处理,将训练集和测试集及预测数据共同作为训练向量集,以此建立新型支持向量诱导回归算法。本文利用该算法对实时售后服务的“千车故障数”进行了时间序列分析,并建立了新型的ε-不敏感损失函数小样本模型预测系统。预测显示误差小于5.3%的值占了总体的98.1%,其预测置信度达到0.983,与二次和Huber损失函数相比其MAPE值只有2.3%。用计算机模拟仿真单批次预测显,当时间参量t→+∞,“千车故障数”将收敛于定值74.0601,这和实际相当吻合,表明所建预测模型的有效性。文章最后还和传统神经网络模型作了比较,说明新型SVM机比神经网络处理小样本能力更强。  相似文献   

8.
基于PSO算法的支持向量机核参数选择问题研究   总被引:2,自引:0,他引:2  
核函数中的参数选择是支持向量机中的一个非常重要的问题,它直接影响到模型的推广能力.本文提出了采用粒子群算法搜索支持向量机最优核参数的方法,并在Checker数据集上进行了实验,实验结果表明,通过这种方法选择出来的核参数能够提高分类正确率以及预测正确率,具有一定的实用性.  相似文献   

9.
为了能够提升视频技术下车辆检测的正确率,论文提出结合使用HOG特征与SIFT特征作为车辆检测的特征提取算法,再通过支持向量机(SVM)将样本数据划分为训练集与验证集,使用不同核函数进行训练和验证,确定最优核函数为高斯核函数.最后将训练的模型使用到视频文件进行车辆的预测.最终,实验数据表明,该方法提升了传统的HOG+SVM的样本检测效率,高斯核函数下检测率高达98.38%.处理视频文件时车辆检测效果良好,但是模型仍不够稳定,希望日后完善训练集继续改进算法.  相似文献   

10.
李恒杰 《计算机应用》2007,27(6):1339-1342
Online支持向量机作为一种新的分类方法可以在异常入侵检测中提供良好的分类效果。根据Online算法对传统支持向量机、Robust支持向量机和One-class支持向量机进行改进,将改进后的算法与原始算法进行比较,然后使用1999 DARPA数据作为评估数据。通过实验和比较发现,改进后的支持向量机可以实现在线训练,而且使用更少的支持向量,训练时间也有效缩短,在噪声数据存在的情况下检测正确率和虚警率比未改进前有一定程度的提升。  相似文献   

11.
基于一级结构信息预测蛋白质热稳定性,对于利用计算机筛选热稳定性蛋白具有重要意义。本文采用k-近邻算法从序列出发预测蛋白质的热稳定性,用自一致性检验、交叉验证和独立样本测试等三种方法评估。仅用20种氨基酸组成作为特征变量时,识别的正确率分别可达100%,87.7%和89.6%;而引入8个新变量后,其精度分别为100%,89.6%和90.2%,对小蛋白质分子识别的精度提高了2.4%。同时探讨了蛋白质分子大小对识别效果的影响。  相似文献   

12.
大坝潜在风险预测在降低大坝溃坝概率、减少水库大坝失事事件方面发挥着重要的作用。本文基于随机森林方法构建基于数据驱动的大坝潜在风险预测模型,减少在建模过程中的人工干预,实现风险预测高效化、智能化。首先预处理大坝基础数据资料,构建训练数据集和测试数据集,然后构建大坝风险预测模型并利用训练数据训练模型,利用GridSearch和Cross-validation确定模型最优情况的参数,并通模型评价指标和多种算法对比结果全面评估模型性能。实验结果表明:基于随机森林的风险预测模型在测试数据上的准确度率为90.54%,模型准确度相较于ANN、KNN、SVM算法高出4.87%、18.59%、37.93%,满足实际应用的需求。  相似文献   

13.
李学明  张朝阳  佘维军 《计算机应用》2016,36(10):2767-2771
针对有监督评论有用性预测方法中的训练数据集难以构造,以及无监督方法缺乏对情感信息支撑的问题,提出基于语义和情感信息构建一种无监督模型,用于对评论有用性进行预测,同时考虑了评论和评论下回复内容对观点的支持度用来计算观点的有用性得分,进而得到评论的有用性。同时,提出结合句法分析和改进潜在狄利克雷分配(LDA)模型的评论摘要方法用于评论有用性预测模型中的观点提取,基于句法分析结果构建must-link和cannot-link两种约束条件指导主题模型学习,在保证召回率的同时提高模型准确率。该方法在实验数据集上能取得70%左右的F1值和90%左右的排序准确率,且实例应用也表明该方法对结果具有较好的解释性。  相似文献   

14.
目的 模型功能窃取攻击是人工智能安全领域的核心问题之一,目的是利用有限的与目标模型有关的信息训练出性能接近的克隆模型,从而实现模型的功能窃取。针对此类问题,一类经典的工作是基于生成模型的方法,这类方法利用生成器生成的图像作为查询数据,在同一查询数据下对两个模型预测结果的一致性进行约束,从而进行模型学习。然而此类方法生成器生成的数据常常是人眼不可辨识的图像,不含有任何语义信息,导致目标模型的输出缺乏有效指导性。针对上述问题,提出一种新的模型窃取攻击方法,实现对图像分类器的有效功能窃取。方法 借助真实的图像数据,利用生成对抗网络(generative adversarial net,GAN)使生成器生成的数据接近真实图像,加强目标模型输出的物理意义。同时,为了提高克隆模型的性能,基于对比学习的思想,提出一种新的损失函数进行网络优化学习。结果 在两个公开数据集CIFAR-10(Canadian Institute for Advanced Research-10)和SVHN(street view house numbers)的实验结果表明,本文方法能够取得良好的功能窃取效果。在CIFAR-10数据集上,相比目前较先进的方法,本文方法的窃取精度提高了5%。同时,在相同的查询代价下,本文方法能够取得更好的窃取效果,有效降低了查询目标模型的成本。结论 本文提出的模型窃取攻击方法,从数据真实性的角度出发,有效提高了针对图像分类器的模型功能窃取攻击效果,在一定程度上降低了查询目标模型代价。  相似文献   

15.
付华  訾海 《计算机应用》2015,35(1):289-293
针对瓦斯涌出量的多影响因素预测问题,提出一种最小二乘支持向量机(LS-SVM)回归算法与卡尔曼滤波耦合的动态预测方法.该方法依据预测残差方差比检验策略确定自适应的动态训练样本集以取代固定的训练样本集.LS-SVM辨识网络对瓦斯涌出量的相关因素进行非线性映射并提取出最佳维数的状态向量以建立基于卡尔曼滤波最优估计的瓦斯涌出量预测模型.利用矿井监测到的各项历史数据进行实验.结果表明,该模型的预测平均相对误差为2.17%,平均相对变动值ARV为0.008873,相比单一的神经网络或支持向量机预测模型,具有更高的预测精度与更强的泛化能力.  相似文献   

16.
基于多模态生理数据的连续情绪识别技术在多个领域有重要用途,但碍于被试数据的缺乏和情绪的主观性,情绪识别模型的训练仍需更多的生理模态数据,且依赖于同源被试数据.本文基于人脸图像和脑电提出了多种连续情绪识别方法.在人脸图像模态,为解决人脸图像数据集少而造成的过拟合问题,本文提出了利用迁移学习技术训练的多任务卷积神经网络模型.在脑电信号模态,本文提出了两种情绪识别模型:第一个是基于支持向量机的被试依赖型模型,当测试数据与训练数据同源时有较高准确率;第二个是为降低脑电信号的个体差异性和非平稳特性对情绪识别的影响而提出的跨被试型模型,该模型基于长短时记忆网络,在测试数据和训练数据不同源的情况下也具有稳定的情绪识别性能.为提高对同源数据的情绪识别准确率,本文提出两种融合多模态决策层情绪信息的方法:枚举权重方法和自适应增强方法.实验表明:当测试数据与训练数据同源时,在最佳情况下,双模态情绪识别模型在情绪唤醒度维度和效价维度的平均准确率分别达74.23%和80.30%;而当测试数据与训练数据不同源时,长短时记忆网络跨被试型模型在情绪唤醒度维度和效价维度的准确率分别为58.65%和51.70%.  相似文献   

17.
如何在受限时间内满足深度学习模型的训练精度需求并最小化资源成本是分布式深度学习系统面临的一大挑战.资源和批尺寸超参数配置是优化模型训练精度及资源成本的主要方法.既有工作分别从计算效率和训练精度的角度,对资源及批尺寸超参数进行独立配置.然而,两类配置对于模型训练精度及资源成本的影响具有复杂的依赖关系,既有独立配置方法难以...  相似文献   

18.
陈文兵  管正雄  陈允杰 《计算机应用》2018,38(11):3305-3311
深度卷积神经网络(CNN)在大规模带有标签的数据集训练下,训练后模型能够取得高的识别率或好的分类效果,而利用较小规模数据集训练CNN模型则通常出现过拟合现象。针对这一问题,提出了一种集成高斯混合模型(GMM)及条件生成式对抗网络(CGAN)的数据增强方法并记作GMM-CGAN。首先,通过围绕核心区域随机滑动采样的方法增加数据集样本数量;其次,假定噪声随机向量服从GMM描述的分布,将它作为CGAN生成器的初始输入,图像标签作为CGAN条件,训练CGAN以及GMM模型的参数;最后,利用已训练CGAN生成符合样本真实分布的新数据集。对包含12种雾型386个样本的天气形势图基准集利用GMM-CGAN方法进行数据增强,增强后的数据集样本数多达38600个,将该数据集训练的CNN模型与仅使用仿射变换增强的数据集及CGAN方法增强的数据集训练的CNN模型相比,实验结果表明,前者的平均分类正确率相较于后两个模型分别提高了18.2%及14.1%,达到89.1%。  相似文献   

19.
为提高民航飞机发动机性能参数的预测精度,本文提出一种基于模糊推理和XGBoost算法的发动机性能参数预测方法。对发动机进行总体性能分析,确定油门杆位置、气压高度、总温、全重、马赫数及飞行阶段为影响发动机性能参数的主要因素。其次采用模糊推理对快速存取记录器(QAR)数据进行纵向飞行阶段划分,消除人为划分训练数据对预测精度的主观影响。最后,建立各发动机性能参数的XGBoost预测模型,并与多种预测模型进行对比实验。实验结果表明:对发动机N1、燃油流量参数的预测,XGBoost预测模型相比支持向量回归(SVM)、线性回归模型和BP神经网络,其精度更高且不需要对训练数据进行缩放。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号