首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
结合大量犯罪数据特征和行为特征,提出一种PCA-XGBoost联合预测模型。采用PCA算法提取数据集的主要特征;应用XGBoost算法提升预测优化和泛化能力,并通过三种检验方法进行准确率检验。此外,经与XGBoost、CART、RF、NB和LR等分类算法模型的预测结果进行对比,表明PCA-XGBoost联合预测模型对盗窃犯罪数量的预测准确度明显高于其他预测模型,具有较高的应用价值。  相似文献   

2.
近年来,随着在线信贷的飞速发展,贷款总量不断加大,违约概率不断提升。因此对贷款风险进行深入研究,对在线信贷企业预防互联网金融风险是非常具有现实意义的。针对贷款数据非平衡分布、大量噪声、维度高的问题,本文提出一种基于SMOTE和XGBoost的贷款风险预测方法。通过特征工程对数据进行降维和去噪;针对数据的非平衡问题,使用SMOTE算法进行过采样,平衡正负样本数目;基于以上工作,构建XGBoost分类模型,与一些传统分类算法进行对比,然后对比在不同正负样本比例时,预测结果的有效性。实验表明,相比于传统分类模型,XGBoost算法在贷款风险预测模型中具有更好的效果,通过SMOTE算法增加少数类样本的比例可以提高预测结果的有效性。  相似文献   

3.
人力资源管理在决策方式上逐渐智能化。为了辅助人力资源进行员工晋升决策,提高管理者晋升决策的公平性和有效性,提出基于集成学习的极端梯度提升(XGBoost)模型对数据分布不平衡的员工晋升数据进行预测分析。以Kaggle(数据科学竞赛平台)的员工晋升数据集为对象进行预处理,建立基于XGBoost算法的员工晋升预测模型,结合准确率、F1值和AUC值这几个评价指标,与其他算法模型进行比较分析。实验结果表明,相比逻辑回归(LR)、支持向量机(SVM)、人工神经网络(ANN)、多层感知机(MLP)模型,XGBoost模型的三项评价指标更具优势,应用于员工晋升预测,效果更好。  相似文献   

4.
为提高民航飞机发动机性能参数的预测精度,本文提出一种基于模糊推理和XGBoost算法的发动机性能参数预测方法。对发动机进行总体性能分析,确定油门杆位置、气压高度、总温、全重、马赫数及飞行阶段为影响发动机性能参数的主要因素。其次采用模糊推理对快速存取记录器(QAR)数据进行纵向飞行阶段划分,消除人为划分训练数据对预测精度的主观影响。最后,建立各发动机性能参数的XGBoost预测模型,并与多种预测模型进行对比实验。实验结果表明:对发动机N1、燃油流量参数的预测,XGBoost预测模型相比支持向量回归(SVM)、线性回归模型和BP神经网络,其精度更高且不需要对训练数据进行缩放。  相似文献   

5.
在推荐系统中,针对用户的冷启动问题,提出一种融合协同过滤的XGBoost推荐算法。根据基于用户相似度的协同过滤推荐算法进行粗粒度召回,得到部分用户的召回集,使用XGBoost算法对召回集中的项目进行预测。对于存在冷启动问题的用户,直接使用XGBoost算法对候选集中的项目进行预测。该算法采用CCIR2018个性化推荐评测的在线评测数据集,并将推荐结果投放到知乎提供的线上平台进行评测。评测结果表明,该算法可以解决用户的冷启动问题,具有很高的执行效率,准确度高,在线上评测中取得显著的推荐效果。  相似文献   

6.
针对现有RPA机器人销售账目自动对账精度不足的问题,提出基于XGBoost融合算法进行RPA销售账目核对机器人设计,并重点对XGBoost的融合算法进行设计。在XGBoost融合算法中,通过多层采样的OPTICS进行数据类簇划分,以挖掘财务数据中的从属关系,完善数据逻辑,通过XGBoost根据OPTICS输出的类簇信息进行数据分类,以降低XGBoost对训练过程的依耐性;在RPA销售账目核对机器人中,以时间+内容的标准形式对销售账目进行命名,然后采用XGBoost融合算法进行账目分类,最后通过pandas进行账目比对。实验结果表明,XGBoost融合算法具有较高的财务数据分类精度、销售账目分类精度;该RPA销售账目核对机器人可按照设定周期对销售账目进行自动核对,且核对精度较高,基本满足设计需求,对企业财务的数字化转型具有一定推动作用。  相似文献   

7.
《微型机与应用》2017,(23):58-61
针对互联网行业的客户流失预测问题,提出了一种社交网络分析和机器学习相结合的客户流失预测方法。考虑到社交活动对用户流失的影响,首先采用社交网络分析方法从用户社交数据中提取特征,然后使用XGBoost(Extreme Gradient Boosting)算法来进行客户流失预测,最后将该方法与其他机器学习算法(Logistic回归、支持向量机和随机森林)进行比较。实验结果表明,所提出的社交网络分析和XGBoost相结合的客户流失预测方法优于传统方法。  相似文献   

8.
为准确预测短时交通流,缓解交通拥堵提高交通运行效率,提出一种基于CNN-XGBoost的短时交通流预测方法。结合短时交通流数据的时间相关性和空间相关性,将本路段和邻近路段的历史数据一同作为输入进行预测。利用卷积神经网络(convolutional neural networks,CNN)实现特征提取以减少数据冗余性,提出一种参数经果蝇算法优化的XGBoost模型用于交通流量预测。实例验证结果表明,CNN可对时间和空间结合下的交通流数据进行有效特征提取;相比SVR、LSTM等模型,改进的XGBoost模型下的交通流量预测误差明显减小。  相似文献   

9.
龚追飞  魏传佳 《计算机科学》2021,48(12):226-230
为了提高复杂网络链路预测的性能,采用拓扑相似和XGBoost算法来完成复杂网络链路预测.利用复杂网络拓扑结构建立邻接矩阵,求解共同邻居集合,然后根据拓扑相似理论计算复杂网络相似得分函数,将各个时间窗的得分函数和权重参数作为输入,采用XGBoost算法实现复杂网络的链路预测.通过差异化设置XGBoost算法的两个正则化系数,测试其对链路预测准确率的影响,获取最优正则化系数,从而得到稳定的XGBoost链路预测模型.实验证明,时间窗数量设置合理的情况下,相比常用网络链路预测算法,基于拓扑相似和XGBoost算法的预测准确率优势明显,且预测时间性能和其他算法的差距较小,尤其适用于大规模的复杂网络链路预测.  相似文献   

10.
旨在通过机器学习XGBoost算法发现分布式数据库海量运维性能数据潜在的规律,实现对分布式数据库关键性能指标的预测,提升分布式数据库运维的智能化水平。  相似文献   

11.
为了使高校的就业指导工作更具针对性,可以有针对性地培养学生,本文收集了毕业生的相关信息及其各自的就业情况,构建了基于HMIGW特征选择和XGBoost的分类预测建模算法,并将其应用于毕业生就业预测.本文首先考虑到学生信息数据具有离散型和连续型混合的特点,提出一种适应于就业预测的基于互信息和权重的混合(Hybrid feature selection based on Mutual Information and Gain Weight,以下简称HMIGW)特征选择算法,该方法先对学生数据的特征做相关性估值,然后采用前向特征添加后向递归删除策略进行特征选择,最后基于选择后的最优特征子集数据用XGBoost预测模型进行训练与结果预测.通过对比不同算法的结果,本文采用的预测方法在准确率和时间等评价指标上有较好的表现,对于毕业生培养就业指导具有积极作用.  相似文献   

12.
为解决在数据不平衡条件下使用XGBoost框架处理二分类问题时算法对少数类样本的识别能力下降的问题,提出了基于代价敏感激活函数的XGBoost算法(Cost-sensitive Activation Function XGBoost,CSAF-XGBoost).在XGBoost框架构建决策树时,数据不平衡会影响分裂点的...  相似文献   

13.
为了进一步提升水务企业工作效率,解决抄表数据审核工作量大、保证数据准确性等问题,在传统的XGBoost预测算法基础上提出一种基于MIC-XGBoost的混合预测模型.以某水务企业近两年的用户历史用水数据为基础,利用最大信息系数(MIC)得出不同影响因素与用户用水量之间变量的关联程度,构建不同单一影响因素下的用水量数据预测模型,采用实际用水数据调整算法参数,得到最终预测模型.实验结果表明,在预测精度上该模型比单一的XGBoost模型提高了约21%,能有效提升数据审核效率.  相似文献   

14.
涂装是修造船企业最大的能耗单元,能耗预测是船舶智能能效优化中的一项重要任务。应用XGBoost模型对船舶特涂工序能耗进行分析。采用基于博弈论的SHAP(解释机器学习模型输出)方法解释变量因子对目标准确预测的影响。利用粒子群算法(PSO)优化XGBoost模型超参数,从而构建PSO-XGBoost模型对船舶特涂工序能耗历史数据进行训练拟合,并与其他能耗预测模型进行对比实验。结果表明,基于PSO-XGBoost的船舶特涂工序能耗预测模型的预测结果误差MAPE仅为12.21%,效果优于XGBoost、LR、KNN、RF模型。  相似文献   

15.
陈静杰  王琨 《计算机科学》2021,48(7):178-183
对油耗数据进行区间预测时,数据的不平衡性会导致一般的区间预测方法得到的预测区间质量较低.针对上述问题,提出了基于SMOTE-XGBoost算法的区间预测模型.采用SMOTE算法增加训练集中少数类样本的数量,消除了训练集数据的不平衡性;对XGBoost算法的分位数损失函数进行改进,平滑其一阶导数原点周围的小区域,解决了分位数损失函数对树分裂的影响;通过训练区间预测模型,得到预测区间的上下界.最后基于QAR数据集进行对比实验,结果表明,该方法使预测区间具有较高的区间覆盖率和较窄的区间宽度,提高了预测区间的质量.  相似文献   

16.
针对无线传感器网络(WSN)中能量、带宽和内存等各种资源的限制问题,提出了一种XGBoost结合加权自适应分层分数最小均方误差(hierarchical fractional least-mean-square,HFLMS)的数据约减组合预测方法。首先,利用XGBoost方法对损失函数进行了二阶的泰勒展开,权衡模型的复杂度和损失函数的下降速度,实现了资源限制的稳定预测;然后提出自适应HFLMS滤波器实现WSN数据约简的传输,并基于误差估计来预测所感测的数据,有效降低了WSN中的能量约束;最后,利用两个评估参数(能量和预测误差)来验证所提组合预测方法的性能。实验结果表明,相比没有预测、近似最速下降算法和分层最小均方滤波技术,提出的预测方法获得的预测结果更好。  相似文献   

17.
针对高校贫困生认定工作中存在的问题,利用校园一卡通数据,综合学生消费和生活规律,结合XGBoost(Extreme Gradient Boosting)模型和主成分分析法、过采样算法,建立高校贫困生的分类预测方法。该方法在贫困生分类预测中的准确率较高。实验结果证明,采用XGBoost模型比其他模型预测准确率更高,为我国高校贫困学生的评定标准提供重要依据,保证了贫困学生认定工作的公正性。  相似文献   

18.
准确、高效的交通流预测是实现交通诱导和交通控制的前提和关键。针对传统机器学习方法需要人工构造特征、无法充分提取交通流的时空特征等问题,提出一种混合预测模型,该模型结合卷积神经网络(Convolutional Neural Network,CNN)和XGBoost(Extreme Gradient Boosting)各自的优势,在网络底层使用CNN对交通流数据进行特征的自动提取和选择,并将得到的高维特征向量输入到XGBoost模型中进行预测。为验证模型有效性,取高速路段的交通流数据对CNN模型、XGBoost模型和CNN-XGBoost模型进行实验对比,结果表明,在预测精度上,CNN-XGBoost模型比CNN模型和XGBoost模型分别提高了约6%和7%,是一种有效的短时交通流预测模型。  相似文献   

19.
如何准确高效地预测销量是企业一直以来关注的重要问题.传统的时间序列预测方法虽然在研究和实践中占主导地位,但是存在一定的局限性.随着大数据的发展,电商企业能获取前所未有的数据量和数据特征,仅利用过去的行为和趋势很难准确地对销量进行预测.本文提出一种基于随机森林、GBDT、XGBoost算法的成本厌恶偏向性组合预测模型,并...  相似文献   

20.
为增加信贷风险预测算法的准确率,降低信贷风险,提出一种基于特征工程下的XGBoost超参数优化模型。使用后剪枝的随机森林进行特征选择,利用基于强化学习的改进Q-learning算法优化XGBoost超参数。实验结果表明,相比较于现有的超参数优化方法,改进的Q-learning在提升算法收敛速度的前提下保证了准确率。该模型在信贷风险预测中的准确率均优于LightGBM、GRU等模型,验证了其有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号