基于三重混合采样和集成学习的潜在高价值旅客发现 |
| |
引用本文: | 冯霞,胡昉.基于三重混合采样和集成学习的潜在高价值旅客发现[J].计算机应用与软件,2024(1):12-17+35. |
| |
作者姓名: | 冯霞 胡昉 |
| |
作者单位: | 1. 中国民航大学计算机科学与技术学院;2. 中国民航信息技术科研基地 |
| |
基金项目: | 国家自然科学基金项目(61502499); |
| |
摘 要: | 考虑潜在高价值旅客特有的数据高度不平衡、旅客特征和价值类别弱相关等问题,提出一种基于三重混合采样和集成学习的潜在高价值旅客发现模型。采用RFM(Recency Frequency Monetary)方法标注旅客类别;使用三重混合采样对不平衡旅客数据集进行重采样;使用融合特征选择算法遴选旅客特征;使用梯度提升决策树作为分类器,构建旅客价值预测模型,识别潜在高价值旅客。在PNR数据集上的实验结果表明,与基准算法相比,该模型能取得更好的AUC值和F1值,可以较好地识别潜在高价值旅客。
|
关 键 词: | 航空运输 三重混合采样 特征重要性排序 潜在高价值旅客 不平衡分类 集成学习 |
|
|