首页 | 本学科首页   官方微博 | 高级检索  
     

互联网广告点击率预估模型中特征提取方法的研究与实现
引用本文:田嫦丽,张珣,潘博,杨超,许彦茹.互联网广告点击率预估模型中特征提取方法的研究与实现[J].计算机应用研究,2017,34(2).
作者姓名:田嫦丽  张珣  潘博  杨超  许彦茹
作者单位:北京工商大学 计算机与信息工程学院,北京工商大学 计算机与信息工程学院,北京工商大学 计算机与信息工程学院,北京工商大学 计算机与信息工程学院,北京工商大学 计算机与信息工程学院
基金项目:北京市自然基金重点项目B类(资助号:KZ201410011014; 2015年研究生科研能力提升计划项目资助;北京市自然科学基金青年项目(9164025);教育部人文社会科学研究青年基金项目(15YJCZH224)
摘    要:互联网广告是一个具有上千亿元规模的市场。广告的点击率是互联网广告投放效果的重要指标。在广告点击率预估模型中,特征提取是关键因素,特征的好坏直接影响到最终模型的效果。针对如何提高广告点击率预估效率问题,在Hadoop大数据平台环境中,提出了基于梯度提升决策树GBDT(Gradient Boost Decision Tree)模型的多维特征提取方法。该方法利用原始数据构建多维基础特征库,并将基础特征库中除ID类特征以外的其余特征输入GBDT模型进行特征刷选,得到高层特征,进一步进行分类。该方法的使用不仅减少了特征提取的人工成本和时间成本,也在很大程度上提升了模型的精度。

关 键 词:CTR预估  特征提取  互联网广告  Hadoop大数据平台  GBDT
收稿时间:2016/1/29 0:00:00
修稿时间:2016/12/26 0:00:00

Research and Implementation of the feature extraction methods of Internet CTR Prediction model
TIAN Chang-li,ZHANG Xun,PAN Bo,YANG Chao and YANG Yan-ru.Research and Implementation of the feature extraction methods of Internet CTR Prediction model[J].Application Research of Computers,2017,34(2).
Authors:TIAN Chang-li  ZHANG Xun  PAN Bo  YANG Chao and YANG Yan-ru
Affiliation:School of Computer Information Engineering,Beijing Technology and Business University,,School of Computer Information Engineering,Beijing Technology and Business University,School of Computer Information Engineering,Beijing Technology and Business University,School of Computer Information Engineering,Beijing Technology and Business University
Abstract:
Keywords:CTR prediction  feature extraction  Internet advertising  Hadoop big data platform  GBDT
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号