首页 | 本学科首页   官方微博 | 高级检索  
     

基于集成学习方法的点击率预估模型研究
引用本文:贺小娟,潘文捷,程宏. 基于集成学习方法的点击率预估模型研究[J]. 计算机工程与科学, 2019, 41(12): 2278-2284
作者姓名:贺小娟  潘文捷  程宏
作者单位:上海对外经贸大学统计与信息学院,上海 201620;上海立信会计金融学院统计与数学学院,上海 201209
基金项目:上海市青年科技英才"扬帆计划"项目;上海立信会计金融学院统计学一级学科建设项目
摘    要:由于互联网中积累的广告日志具有数据稀疏、特征量大、正负样本分布极其不均匀等问题,使得人工特征提取费时费力,并且单一预测模型很难得到更好的预测性能。针对这些问题,提出梯度提升树GBDT和Stacking相融合的点击率预测模型GBDT-Stacking。通过引入梯度提升树自动进行特征提取与构造,并结合Stacking集成模型对在线广告点击率进行预测,有效提高了单个预测模型的性能。在真实广告数据集上的实验结果表明,GBDT-Stacking集成模型比对比模型在AUC的取值上至少提升了4%。

关 键 词:梯度提升树  Stacking集成学习  SMOTE  广告点击率

An advertisement click-through rate prediction model based on ensemble learning
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号