首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
近几十年来,人们生活水平显著提高,但是健康意识依旧薄弱,不良的生活习惯和饮食习惯导致糖尿病发病人数急剧增加,由糖尿病导致的各种并发症严重威胁了人们的健康.由于糖尿病具有知晓率低的特点,很多糖尿病患者未能及时发现病症,导致出现并发症.本文通过分析糖尿病的特点,针对医疗数据样本量小、容易缺失的特点,选择IV值分析进行特征选择、使用一种新型的Boosting算法CatBoost进行糖尿病患者预测,取得了显著的预测效果.  相似文献   

2.
银行客户申请信用贷款在授信通过后,精准预测客户是否用信及分析影响客户用信的关键因素,对提高银行客户服务能力及盈利能力具有重要意义.目前,机器学习算法鲜有在用信预测方面的应用,且金融用信领域缺乏模型可解释性的研究,为此提出一种基于CatBoost的TreeSHAP解释性用信预测模型.通过CatBoost构建用信预测模型,利用3种超参数优化算法对该模型进行对比优化,与基线模型在4项主要性能指标上进行实验对比,结果表明经TPE算法优化后的模型性能均优于其他模型,然后结合TreeSHAP方法从全局和局部的层面增强模型的可解释性,解释性分析客户用信的影响因素,为银行对客户进行精准化营销提供决策依据.  相似文献   

3.
对山地地区建立滑坡敏感性模型,从而有效地避免地质灾害带来的风险,对促进地区经济发展和保证人民财产安全具有重要意义。以贵州省毕节市大方县为例,利用Borderline-SMOTE算法解决滑坡数据普遍存在的数据不平衡问题,进而运用CatBoost算法构建山体滑坡模型,最终选取查准率、召回率、F1-score和AUC作为模型评估指标进行对比。实验表明,利用经Borderline-SMOTE算法处理后的滑坡数据集构建的CatBoost模型相比较于传统机器学习模型的预测效果更好,尤其在AUC指标上效果提升显著,同时进一步说明了基于CatBoost算法的滑坡敏感性模型有着良好的分类效果。  相似文献   

4.
在推荐系统中,针对推荐准确度问题,提出了一种融合协同过滤和CatBoost的混合推荐算法(UCF-CB).在协同过滤模块中对用户相似度计算公式进行改进,加入时间衰减因子以及热门物品惩罚项,利用改进后的协同过滤算法对用户项目评分矩阵进行评分预测,得到用户对物品的一次评分.对协同过滤一次评分进行降序排序,选取评分最高的前κ...  相似文献   

5.
设计了基于CatBoost算法的多传感器信息融合可燃气体燃爆状态监测系统,其中甲烷采集使用响应更快的催化燃烧传感器和测量范围更大的红外甲烷传感器进行配合采集,使其能在高浓度气体环境中快速检测甲烷浓度。首先将获取的传感器数据通过梯度提升树算法筛选出最能表征燃爆状态的特征;然后使用SMOTEENN算法对特征集进行类不平衡处理;最后通过CatBoost算法对数据进行分类训练得到预测模型。该模型对可燃气体燃爆状态的分类具有较高的准确率。  相似文献   

6.
为了解决个人歌曲喜好的预测问题,提出了一种基于Cat Boost算法的预测方法。使用Spotify所提供的音乐数据集进行研究,利用Cat Boost模型的建立进行预测。实验结果表明,基于Cat Boost算法的模型个人音乐喜好预测方法预测准确度高,能够更好地利用类别信息,是机器学习在音乐推荐领域的成功应用。  相似文献   

7.
通过传统的监测手段获取矿压数据并采用统计学或机器学习算法对矿压进行预测已不能满足矿山智能化发展要求,需要寻求新的方法提升矿压数据监测及矿压预测的准确性和实时性。基于三维相似物理模型试验,搭建分布式光纤监测系统,沿模型走向和高度2个方向预埋分布式光纤,在模拟工作面开采过程中采集来压数据,并引入光纤布里渊频移平均变化度作为判断是否来压的指标;通过对光纤监测数据进行噪声去除、归一化及相空间重构等预处理,将一维初始监测数据转换为三维数据;使用贝叶斯算法对CatBoost算法进行迭代参数寻优,在达到最大迭代次数后将最优参数组合装载到CatBoost算法中,通过训练得到矿压显现预测模型。结果表明:贝叶斯算法比传统网格搜索法的迭代次数更少、误差更小;与随机森林(RF)、梯度提升决策树(GBDT)和极值梯度提升树(XGBoost)算法相比,CatBoost算法的预测精度更高、泛化能力更强;基于贝叶斯算法优化的CatBoost矿压显现预测模型能准确预测出测试集中的3次来压,且整体预测趋势与实测值较为吻合,平均绝对误差为0.009 1,均方根误差为0.007 7,决定系数为0.933 9。  相似文献   

8.
针对目前我国烟草生态适宜性定量评价研究较少,烟草种植区划缺少必要的依据等问题,根据适宜性评价中存在的模糊性特点,将模糊综合评判法应用于烟草生态适宜性评价,建立了定量评价模型。并在河南省进行了实证研究,评价结果与目前烟草的实际分布有较高的吻合度,因此模糊综合评判可作为烟草生态适宜性评价的一种重要方法。  相似文献   

9.
开展海南岛海岸带土地利用适宜性评价对实现其土地资源合理配置有着重要意义。采用2000年、2010年和2020年3期土地利用数据,利用土地利用适宜性评价模型(Land Use Suitability Evaluation Model,LandUSEM),优选适用于研究区的海岸带土地利用适宜性评价因子,得到海岸带土地利用适宜度空间分布及变化结果。研究表明:(1)海南岛海岸带土地利用适宜性年均值较高,整体适宜性较好。2000至2020年,研究区土地利用适宜性整体上先升高后降低。(2)在依据最新发展规划纲要将海南岛海岸带划分的四大区域中,南部组团土地利用综合适宜性最好,而北部组团最差。(3)土地利用类型与土地利用适宜性存在耦合性。近海地区适宜度变化相对明显,且人造地表扩张强烈,限制海岸带城镇建设用地扩张具有必要性。  相似文献   

10.
基于GIS的土地适宜性评价模型的改进   总被引:16,自引:0,他引:16       下载免费PDF全文
首先介绍了基于GIS的常规土地适宜性评价模型(LSEM),并指出它有两个主要缺点:一是同一级别内的不同类别没有显示出评分的区别;二是不同级别的分界处评分差别过份拉大。然后,利用专家系统中确信度(Certainty Factor)概念对其进行了改进。研究表明,经过改进的LSEM具有包含信息更丰富、更精确的特点,能为决策者提供更多的选择余地。  相似文献   

11.
在故障集和差错属性集的基础上,通过结合了基于概率论的符号学习与神经网络学习的增量式混合型多概念获取算法IHMCAP寻找属性值与故障类型之间的对应关系,由此建立一个故障诊断模型.实验表明,该模型不仅精度高、速度快、学习能力强,而且在利用系统的先验知识与新增数据上也取得了均衡.  相似文献   

12.
目标跟踪是计算机视觉领域核心问题之一。近十年来目标跟踪技术取得较快发展,新理论、新方法、新工具层出不穷。基于中心距误差、成功率及最好结果三个度量标准,将当前视频跟踪中常用的八种目标跟踪算法应用于养殖场动物(例如奶牛)跟踪,并给出影响跟踪性能的详细分析。  相似文献   

13.
苟孟洛 《计算机安全》2014,(5):12-13,18
随着互联网的高速发展和办公自动化的日益普及,PDF(portable document format)文件已经成为全球电子文档分发的开放式标准,由于PDF文档的高实用性和普遍适应性,使其成为有针对性钓鱼攻击的有效载体。恶意代码对计算机的严重破坏性,检测和防止含有恶意代码的PDF文档已日益成为计算机安全领域的重要目标。通过从文档中提取特征数据,提出了一个基于机器学习算法的恶意PDF检测框架,最后并通过实验验证了其检测模型的有效性。  相似文献   

14.
生态位因子分析方法是一种基于生态位概念的多变量分析方法,然而该方法在计算相关性时所使用的协方差只考虑了变量间的线性关系,而大部分变量间的关系是非线性相关的.互信息可用于衡量两个变量间相互依赖的强弱程度,且不局限于线性相关.本文提出基于互信息的生态位因子分析方法,采用互信息计算变量间的相关性,分析斑头雁在青海湖地区的栖息地选择情况以及栖息地适宜性,与传统生态位因子分析方法相比,所提出的方法改变了特化向量,提高了栖息地适宜性预测的准确率.  相似文献   

15.
针对分布式系统的负载分配问题,通过对生态捕食模型的研究,提出一种基于生态差分方程数学模型、分布式控制的网络负载平衡算法。该算法将两节点对应到生态系统的捕食者和被捕食者,将各节点的负载信息对应到种群规模,利用两种群生态差分方程数学模型动态调整节点负载信息,达到网络负载平衡。实验证明了该算法的有效性。  相似文献   

16.
《信息与电脑》2019,(21):68-69
大数据分析的方法有很多,借助机器学习模型对大数据进行挖掘优化是现今较为有效的方法。基于此,笔者提出基于机器学习模型的大数据挖掘优化算法,以机器学习技术为基础,建立分布式挖掘模型,通过计算数据相异度,完成数据挖掘中心的优化。实验结果表明,本设计算法在总计算量和预测准确度上均胜于传统算法,证明了方法的有效性和实用性。  相似文献   

17.
为在开放网络环境中建立资源消费者(用户)和资源提供者(主机)之间的信任关系,提出基于机器学习的动态信誉评估模型 .模型中用户的信誉级别可以根据其行为和一些其他监测数据动态变化,而资源的信誉级别也可以根据用户对资源所提供服务的评价动态变化 .给出了用于生成评估规则和信誉级别的模糊信誉级别评估算法(FTEA),算法采用基于规则的机器学习方法,具有从大量输入数据中自学习以获取评估规则的能力 .实验结果表明,1000组输入数据能够生成理想的规则库,并且算法执行时间随输入判定因素数目成指数形式增长,因此需要选择5~6个因素和1000个左右的样本数据以进行系统实现 .  相似文献   

18.
宏病毒是存在于Office文档中的病毒,虽然传统杀毒软件可以扫描已有宏病毒,但是对于新出现的宏病毒处理仍然存在不足.使用机器学习的方法,通过比较正常宏和有害宏的特征不同,提出了一种新的宏特征选择方法,并使用SVM算法训练得到分类模型.结合分类模型和宏自身的病毒特征进行综合判断,从而可以达到对新出现宏的类别预测.实验结果...  相似文献   

19.
电子音乐音乐信号辨识是一个种模式识别问题,当前音乐信号辨识方法存在误差大、速度慢,抗噪鲁棒性差等缺陷,为了提高音乐信号辨识正确率,提出了一种基于机器学习算法的电子音乐信号辨识方法.首先对电子音乐信号进行采集,并引入去噪方法对其进行预处理,抑制噪声对音乐信号辨识的干扰,提高抗噪鲁棒性,然后从去噪后的电子音乐信号中提取能够...  相似文献   

20.
基于食物链的生态进化算法   总被引:7,自引:0,他引:7  
借鉴生物在生态环境中的能量传递方式一食物链,提出了一种多模式协同的生态进化算法。同时将该算法应用于典型优化问题求解,实验结果表明此算法具有良好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号