首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 176 毫秒
1.
采用支持向量机(SVM)、随机森林(RF)和逻辑回归(LR)等机器学习方法对脑卒中患者进行分类研究,构建脑卒中疾病预测模型,以期为疾病发生提供早期预警.对kaggle网站下载healthcare-dataset-stroke-data的数据通过SMOTE智能过抽样算法构建均衡数据集,运用支持向量机、随机森林和逻辑回归算法构建脑卒中预测模型.将SMOTE算法优化前后的预测结果进行比较分析,并采用支持向量机、随机森林和逻辑回归算法对优化后的数据集构建疾病预测模型,其结果的准确率、精确度、召回率和ROC值都有明显提高.仿真实验结果可知SMOTE+随机森林算法预测模型的准确率、精确度、ROC值都优于支持向量机和逻辑回归预测模型,可用于脑卒中疾病的早期预测,为医疗手段干预赢得时间,对降低脑卒中的发病具有重要意义.  相似文献   

2.
支持向量机作为非参数方法已经广泛应用于信用评估领域.为克服其训练高维数据不能主动进行特征选择导致准确率下降的缺点,构建C4.5决策树优化支持向量机的信用评估模型.利用C4.5信息熵增益率方法进行属性选择,减少冗余属性.模型通过网格搜索确定最优参数,使用F-score和平均准确率评价模型性能,并在两组公开数据集上进行验证.实证分析表明,C4.5决策树优化支持向量机的信用评估模型有效减少了数据学习量,较于传统各类单一模型有较高的分类准确率和实用性.  相似文献   

3.
提出一种基于支持向量机的缺失值填补方法。该方法将缺失值填补分为连续属性缺失值填补和类别属性缺失值填补两种情况。对于连续属性的情况,采用支持向量机回归进行缺失值的预测;对于类别属性的情况,采用支持向量机分类进行缺失值的预测。在几个UCI数据集和MINIT手写阿拉伯数字数据集上的对比实验说明,该算法较传统的均值填补方法和基于决策树回归的缺失值填补方法具有更高的恢复率。  相似文献   

4.
利用Python语言对5000条新闻数据进行了文本分类.通过词频和TF-IDF统计量构建特征向量,通过精准率和召回率对比前后2种特征提取算法的分类效果,通过逻辑回归、朴素贝叶斯和支持向量机进行分类结果对比,结果表明:对于目标新闻文本,在同等条件下,使用TF-IDF构建词向量模型的精准率和召回率比使用词频词襞模型分别高出0.013和0.012个百分点.在使用TF-IDF特征的基础上,朴素贝叶斯、逻辑回归和支持向量机算法的准确率是依次上升的,其中支持向量机的精度最好.  相似文献   

5.
基于SVM和PSO的图像质量评价   总被引:1,自引:0,他引:1       下载免费PDF全文
李翔 《计算机工程》2012,38(23):215-218
为提高白噪声、高斯模糊、JPEG2000压缩等失真类型图像的评价准确率,提出一种基于支持向量机和粒子群优化算法的图像质量评价方法。提取样本图像数据和确定评价指标,对样本数据进行预处理。利用粒子群优化算法选择最优参数,使用最优参数对训练集数据进行训练,对预测集数据进行预测分析,并建立图像质量评价模型。实验结果表明,与线性回归模型、BP神经网络模型等传统方法相比,该方法的评价准确率较高,能够准确地反映人眼对图像的视觉感知。  相似文献   

6.
在大数据环境下,为了提高航班延误预测精确度和数据处理速度,提出基于Spark框架下处理海量数据方法。本文使用决策树算法对航班数据进行分析,预测航班的延误情况,并与使用支持向量机,Logistic回归分类算法的预测结果进行比较。结果证明决策树算法具有较高的准确率和灵敏度,表明决策树算法可以应用到航班延误预测中,给航空机构提供数据支持。  相似文献   

7.
电力系统负荷预测是当前国内外的研究热点,支持向量回归算法是一种解决电力系统负荷预测问题非常有效的方法,如何根据特定数据集选择合适的模型参数,以保证建立好的模型有很好的推广性能,成为设计支持向量回归机的关键一步。本文采用了1-范数、2-范数以及v-支持向量回归算法来解决支持向量机参数的自动复制问题。在真实数据集上的实验结果表明,新模型在预测能力上较之一些广泛使用的软件可靠性预测模型有明显的提高。  相似文献   

8.
为发掘卷积神经网络在协同过滤预测中的潜力,针对神经自回归模型方法和支持向量机在深度学习中的优势,提出基于深度神经向量机自回归的协同过滤方法。通过将神经网络最后一层的激发函数替换为线性支持向量回归函数的方式,学习基于最小边缘的对数损失。在多个公开数据集上的实验结果表明,该算法在深度神经自回归对协同过滤问题实现较好预测的基础上,线性向量回归函数的使用能更好地提升预测效果。  相似文献   

9.
当前机器学习的技术已经运用到很多工程项目中,但大部分机器学习的算法只有在样本数量充足且运用在单一场景中的时候,才能获得良好的结果。其中,经典的支持向量回归机是一种具有良好泛化能力的回归算法。但若当前场景的样本数量较少时,则得到的回归模型泛化能力较差。针对此问题,以加权ε支持向量回归机为基础,提出了一种小样本数据的迁移学习支持向量回归机算法。该算法以加权ε支持向量回归机为Bagging算法的基学习器,使用与目标任务相关联的源域数据,通过自助采样生成多个子回归模型,采用简单平均法合成一个总回归模型。在UCI数据集和现实数据集——玉米棒与花生粒储藏环节损失数据集上的实验结果表明,该算法较标准ε-SVR算法与改进的RMTL算法在小数据样本上有更好的泛化能力。  相似文献   

10.
为了提高人民生活质量,政府部门不断加强水质管理,然而人工分类方法无法满足实时处理的需求,传统机器学习方法的分类准确率又不够高。集成学习使用多种学习算法来获得比单一学习算法更好的预测性能。首先,对集成学习进行概述,简要介绍了Bagging和Boosting算法,并提出基于协方差自适应调整的进化策略算法(CMAES)的集成学习方法。接着,介绍了数据处理方式、模型评估方法和评价指标。最后,用CMAES集成学习方法对逻辑回归、线性判别分析、支持向量机、决策树、完全随机树、朴素贝叶斯、K-邻近算法、随机森林、完全随机树林、深度级联森林十种模型进行集成。实验结果表明,CMAES集成学习方法优于所有其他模型,该方法将继续被应用到未来的研究之中。  相似文献   

11.
本文针对交通数据挖掘领域的交通流预测问题进行研究和实现.主要对数据挖掘技术应用于交通流数据的特征选择和交通流预测模型的建立提出算法.在对采样数据进行清洗后,以分类与回归决策树作为基学习器,采用梯度提升决策树进行回归拟合,计算出交通数据的特征重要度.并以此重要度作为自适应特征选择的依据.其次,采用聚类算法对选取后的特征数据进行聚类分析,缩小样本大小的同时,同类数据更加相似.最后,以实时数据匹配相应聚类作为训练数据集,使用经过人工鱼群算法优化参数后的支持向量机进行交通流预测.本文结尾通过实验数据论证本文所提出的算法和模型.  相似文献   

12.

针对传统软测量方法存在的预测性能差、融合能力低等缺点, 提出一种基于证据理论(D-S) 合成规则和差分自回归滑动平均(ARIMA) 模型的多模型软测量方法. 首先利用自适应模糊核聚类方法和最小二乘支持向量机建立多个子模型; 然后利用D-S 合成规则构造的概率分配函数作为权值因子, 对子模型输出进行融合以得到多模型的输出; 最后结合ARIMA 模型对静态多模型输出进行动态校正. 仿真研究与工业应用的结果表明, 所提出的方法具有良好的预测性能和融合能力.

  相似文献   

13.
针对逆系统中非线性逆模型辨识困难以及大规模数据采用单模型回归存在精度差和计算量较大的问题,提出了一种基于最近邻聚类的多模型最小二乘支持向量机(LSSVM)逆模型辨识及控制方法。该方法首先使用最近邻聚类算法对数据集做出聚类划分,然后针对每个聚类做最小二乘支持向量回归估计,实现了对系统逆动力学模型的动态辨识。最后将辨识模型作为摔制器模型,与被控对象串联,构成一个动态伪线性对象,从而使非线性对象的控制问题转换为线性对象的控制问题,仿真结果表明基于最近邻聚类的多模型LSSVM逆控制系统辨识能力强,比单模型LSSVM逆摔制系统具有更优的动态跟踪性能,更好的抗干扰能力和鲁棒性。  相似文献   

14.
随着移动互联网的广泛普及,国内网络游戏市场日趋饱和,游戏公司获得新用户的成本不断增加,如何预防存量用户的流失已经成为市场营销的重心。提出了一种基于Spark平台的网络游戏用户流失预测方法,基于一个真实游戏日志数据对用户进行了流失预测。首先,从日志数据中抽取和计算了用户特征;随后,按权重选取了一组重要特征;最后,以特征为输入、流失与否为输出进行了二分类建模。综合比较了随机森林、支持向量机、多层感知机、梯度提升决策树和逻辑回归等6种常见分类算法。实验结果表明,随机森林算法表现最优,模型预测精度达到91%。  相似文献   

15.
胃癌的早期发现对于降低死亡率、提高患者生存质量具有重要意义。现有预测模型通过单一的结构化电子健康记录数据预测患者的癌症患病风险,但是无法有效地整合不同类型的临床数据且不能满足实际的临床需求。提出一种基于多类型异构数据融合的胃癌风险预测模型。利用预训练语言模型提取电子健康记录数据中的入院记录文本信息,采用降噪自动编码器提取实验室检验数据的特征,同时对低维度的结构化数据向量表示的维度进行扩增,以避免低维度的实验检验特征表示被高维度特征淹没。在此基础上,将扩增后的结构化数据向量与高维度的文本表示向量在相同的尺度上进行融合,从而预测患者的患病风险。实验结果表明,该模型的准确率可达到0.949 337,相比支持向量机、逻辑回归、朴素贝叶斯等模型,具有较优的预测性能。  相似文献   

16.
由于LTE网络数据量庞大而且种类繁多,人工路测分析已经无法满足当今对基于路测数据质差小区检测的需求.为了提高质差小区检测的效率与正确率,机器学习逐渐在质差小区检测中得到了应用.本文针对小区数量较少的路测数据,提出了一种基于距离的四维特征的质差小区检测方法.该方法采用聚类算法和人工判断相结合的方式对路测数据进行标定,对比分析了基于距离的四维特征和传统的两维特征的提取效果,并在逻辑回归分类器、决策树分类器、支持向量机分类器和k近邻分类器这4种分类器中进行分类.实验结果表明,基于距离的四维特征比传统的二维特征更有利于质差小区检测;使用四维特征进行分类,支持向量机分类器的效果最好.  相似文献   

17.
基于核模糊聚类的多模型LSSVM回归建模   总被引:6,自引:1,他引:5  
李卫  杨煜普  王娜 《控制与决策》2008,23(5):560-562
针对大规模数据采用单模型回归存在精度差和计算量较大的问题,提出一种基于核模糊聚类的多模型最小二乘支持向量回归建模方法.该方法首先使用基于条件正定核的模糊C均值聚类算法对数据集做出聚类划分;然后针对每个聚类做最小二乘支持向量回归估计;同时根据每个聚类内数据分布的特征,给出了一种简单的核参数选择方法.利用数值仿真实验进行非线性函数估计,实验结果表明了所提出的方法具有良好的精度和泛化能力.  相似文献   

18.
血管紧张素转换酶抑制剂(ACEI)对高血压的治疗具有重要意义。基于从结构复杂的化合物数据库中构建的候选小分子数据集,采用分子对接技术从数据集中筛选出样本构建分类模型。分别采用支持向量机、[K]近邻、决策树、随机森林和贝叶斯方法建立血管紧张素转换酶潜在抑制剂和非抑制剂的分类模型。经结果对比,支持向量机相比于其他方法有更高的预测率,其中模型总体预测率和相关系数分别为82.4%和0.653。研究表明,支持向量机方法对于虚拟筛选血管紧张素转换酶抑制剂具有良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号