引用本文: | 白婷, 刘轩宁, 吴斌, 张梓滨, 徐志远, 林康熠. 基于多粒度特征交叉剪枝的点击率预测模型[J]. 计算机研究与发展, 2024, 61(5): 1290-1298. DOI: 10.7544/issn1000-1239.202220943 |
摘 要: | 
在推荐系统中,学习有效的高阶特征交互是提升点击率预测的关键. 现有的研究将低阶特征进行组合来学习高阶交叉特征表示,导致模型的时间复杂度随着特征维度的增加呈指数型增长;而基于深度神经网络的高阶特征交叉模型也无法很好地拟合低阶特征交叉,影响预测的准确率. 针对这些问题,提出了基于多粒度特征交叉剪枝的点击率预测模型FeatNet. 该模型首先在显式的特征粒度上,通过特征剪枝生成有效的特征集合,保持了不同特征组合的多样性,也降低了高阶特征交叉的复杂度;基于剪枝后的特征集合,在特征元素粒度上进一步进行隐式高阶特征交叉,通过滤波器自动过滤无效的特征交叉. 在2个真实的数据集上进行了大量的实验,FeatNet都取得了最优的点击率预测效果.

|