基于XGBoost的微博流行度预测算法 |
| |
作者姓名: | 任敏捷 靳国庆 王晓雯 陈睿东 袁运新 聂为之 刘安安 |
| |
作者单位: | 人民网传播内容认知国家重点实验室,北京 100733;天津大学电气自动化与信息工程学院,天津 300072;人民网传播内容认知国家重点实验室,北京 100733;天津大学电气自动化与信息工程学院,天津 300072 |
| |
基金项目: | 传播内容认知国家重点实验室开放基金(20K04)。 |
| |
摘 要: | 随着全媒体时代的到来和社交网络的发展,流行度预测在舆情监测和数据话语权的争夺上开始发挥重要的作用。现有的流行度预测研究多集中于外文媒体,对以微博为代表的国内主流媒体进行流行度预测是一个新兴且具有挑战的方向。本文针对微博这一国内社交媒体平台进行研究,通过对微博内容及微博用户的特征分析,设计了多种流行度预测方案,同时,提出了一种基于XGBoost的微博流行度预测算法,将流行度预测问题转换为互动值档位分类问题,在分类式框架下将提取融合后的特征用于模型训练,可以较为准确地对有用户信息的微博的流行度情况进行预测。本文的算法在微博流行度预测数据集中得到验证,并且取得了准确率高达85.69%的优越效果。
|
关 键 词: | 社交媒体预测 XGBoost 特征提取 特征融合 微博流行度 |
收稿时间: | 2021-03-01 |
修稿时间: | 2022-03-01 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《数据采集与处理》浏览原始摘要信息 |
|
点击此处可从《数据采集与处理》下载全文 |
|