首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
结合大量犯罪数据特征和行为特征,提出一种PCA-XGBoost联合预测模型。采用PCA算法提取数据集的主要特征;应用XGBoost算法提升预测优化和泛化能力,并通过三种检验方法进行准确率检验。此外,经与XGBoost、CART、RF、NB和LR等分类算法模型的预测结果进行对比,表明PCA-XGBoost联合预测模型对盗窃犯罪数量的预测准确度明显高于其他预测模型,具有较高的应用价值。  相似文献   

2.
涂装是修造船企业最大的能耗单元,能耗预测是船舶智能能效优化中的一项重要任务。应用XGBoost模型对船舶特涂工序能耗进行分析。采用基于博弈论的SHAP(解释机器学习模型输出)方法解释变量因子对目标准确预测的影响。利用粒子群算法(PSO)优化XGBoost模型超参数,从而构建PSO-XGBoost模型对船舶特涂工序能耗历史数据进行训练拟合,并与其他能耗预测模型进行对比实验。结果表明,基于PSO-XGBoost的船舶特涂工序能耗预测模型的预测结果误差MAPE仅为12.21%,效果优于XGBoost、LR、KNN、RF模型。  相似文献   

3.
在移动App即时缺陷预测领域,大部分研究只关注预测模型的性能,而忽略了模型的可解释性,因此会造成开发人员对缺陷预测模型的预测结果缺乏信任,并阻碍了缺陷预测模型在实践中的应用。主要针对Android移动App即时缺陷预测模型的可解释性展开研究,通过差分进化算法对局部可解释技术LIME方法进行超参优化得到ExplainApp方法,该方法可以对预测结果生成高质量解释。选择了14个实际Android应用程序作为实验对象,最终结果表明,ExplainApp方法可以解释移动App即时缺陷预测模型得到的实例预测结果。ExplainApp方法在拟合优度上要优于原始的LIME方法,可以平均提高94.50%。  相似文献   

4.
为了解决冠心病诊断模型中性能无法满足临床应用要求、缺乏可解释性的问题,提出一种融合XGBoost与SHAP的冠心病预测及其特征分析模型。在对数据集进行特征工程的基础上,将处理好的数据集输入XGBoost模型进行训练,并且对模型进行优化,进一步提高了模型的性能表现;其次,与基于SVM、朴素贝叶斯等六种机器学习模型以及八种主流机器学习模型进行实验对比,参数优化后的XGBoost模型在准确率、特异度、F1值和AUC值四个指标上分别达到0.9942、0.9970、0.9941和0.9998,均优于已有模型;最后引入SHAP框架增强模型可解释性,综合四种模型特征重要性排序结果,识别出影响冠心病的重要因素,为医生作出正确的诊断提供决策参考。  相似文献   

5.
为了及早发现重症监护室中的急性肾损伤高危患者,为其提供适当的护理,实现医疗资源的合理利用,研究建立因果贝叶斯网络模型进行急性肾损伤高危患者死亡风险预测。从重症监护医学信息市场(Medical Information Mart for Intensive CareⅢ, MIMIC-Ⅲ)数据库中筛选了25个研究变量和3 870条患者数据,使用因果发现算法进行特征降维。通过NO TEARS算法构建因果图并建立因果贝叶斯网络进行实验,通过机器学习算法验证重要特征的合理性,并对网络结构进行因果效应估计,模型具有最高的受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic, AUROC)分数,为81.7%,优于逻辑回归(Logistic Regression, LR)、随机森林(Random Forest, RF)和极端梯度提升树(eXtreme Gradient Boosting, XGBoost)。此外,模型的重要特征预测能力在各种建模中都很稳健,构建的因果贝叶斯网络具有更好的预测效果并具备良好的解释能力。  相似文献   

6.
为了有效预测重症监护室脓毒症患者的死亡风险并分析影响结局的因素,建立了脓毒症患者死亡风险预测模型,为脓毒症患者的早期预防和死亡风险控制提供科学的参考依据。本研究以重症监护医学信息市场数据库作为数据来源,从中挑选符合要求的病患,使用贝叶斯网络模型训练相关特征预测脓毒症患者的死亡风险。纳入2 352例脓毒症患者,以患者是否死亡作为最终结局建立模型,模型的风险预测准确率为78.7%,优于逻辑回归模型(72.3%)和决策树模型(71.0%)。贝叶斯网络模型相较于其他模型具有更高的信服力,能够准确预测脓毒症患者的死亡风险,模型的可解释性能够辅助医护人员进行临床决策,同时能够更加合理、科学地分配医疗资源。  相似文献   

7.
人力资源管理在决策方式上逐渐智能化。为了辅助人力资源进行员工晋升决策,提高管理者晋升决策的公平性和有效性,提出基于集成学习的极端梯度提升(XGBoost)模型对数据分布不平衡的员工晋升数据进行预测分析。以Kaggle(数据科学竞赛平台)的员工晋升数据集为对象进行预处理,建立基于XGBoost算法的员工晋升预测模型,结合准确率、F1值和AUC值这几个评价指标,与其他算法模型进行比较分析。实验结果表明,相比逻辑回归(LR)、支持向量机(SVM)、人工神经网络(ANN)、多层感知机(MLP)模型,XGBoost模型的三项评价指标更具优势,应用于员工晋升预测,效果更好。  相似文献   

8.
人工智能促进了风控行业的发展,智能风控的核心在于风险控制,信贷违约预测模型是解决这一问题必须倚靠的手段.传统的解决方案是基于人工和广义线性模型建立的,然而现在通过网络完成的交易数据,具有高维性和多重来源等特点,远远超出了现有模型的处理能力,对于传统风控提出了巨大的挑战.因此,本文提出一种基于融合方法的可解释信贷违约预测模型,首先选取LightGBM、DeepFM和CatBoost作为基模型,CatBoost作为次模型,通过模型融合提升预测结果的准确性,然后引入基于局部的、与模型无关的可解释性方法LIME,解释融合模型的预测结果.基于真实数据集的实验结果显示,该模型在信贷违约预测任务上具有较好的精确性和可解释性.  相似文献   

9.
机器学习在实际应用场景中取得了巨大成功,但无法给出决策的明确解释限制了它在一些领域的应用。为改善其计算结果的不可理解性,一些学者对机器学习的可解释性进行研究,已有针对图像的解释性方法很难对具有时序相关性的文本数据做出正确的解释。针对这一问题,论文提出一种面向时序数据的稳定黑盒局部解释性方法DLEMNA。利用聚类算法解决随机扰动解释造成的不稳定性,引入Fused Lasso约束考量特征之间的时序相关性,通过构建线性模型计算影响决策的重要特征。论文以20newsgroups数据集为实验对象,实验结果表明论文提出的DLEMNA方法在保真性和稳定性两方面优于LIME方法。  相似文献   

10.
平昱恺  黄鸿云  江贺  丁佐华 《软件学报》2022,33(9):3391-3406
目标检测模型已经在很多领域得到广泛应用, 但是, 作为一种机器学习模型, 对人类来说仍然是一个黑盒. 对模型进行解释有助于我们更好地理解模型, 并判断其可信度. 针对目标检测模型的可解释性问题, 提出将其输出改造为关注每一类物体存在性概率的具体回归问题, 进而提出分析目标检测模型决策依据与可信度的方法. 由于原有图像分割方法的泛用性较差, 解释目标检测模型时, LIME所生成解释的忠诚度较低、有效特征数量较少. 提出使用DeepLab代替LIME的图像分割方法, 以对其进行改进. 改进后的方法可以适用于解释目标检测模型. 实验的对比结果证明了所提出改进方法在解释目标检测模型时的优越性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号