基于联合特征和XGBoost的活动语义识别方法 |
| |
作者姓名: | 郭茂祖 张彬 赵玲玲 张昱 |
| |
作者单位: | 1. 北京建筑大学 电气与信息工程学院, 北京 100044;2. 建筑大数据智能处理方法研究北京市重点实验室(北京建筑大学), 北京 100044;3. 哈尔滨工业大学 计算机科学与技术学院, 哈尔滨 150001;4. 深部岩土力学与地下工程国家重点实验室(中国矿业大学), 北京 100083 |
| |
基金项目: | 研究生创新项目;国家自然科学基金;安徽师范大学培育项目;创新团队建设项目;中央高校基本科研业务费专项;北京市教委科技重点项目;教育部卓越工程师教育培养计划项目产学合作协同育人项目 |
| |
摘 要: | 针对以往活动语义识别研究单纯提取时间维度上的序列特征以及周期特征、缺乏对空间信息的深度挖掘等问题,提出一种基于联合特征和极限梯度提升(XGBoost)的活动语义识别方法。首先,挖掘时间信息中的活动周期性特征和空间信息中的经纬度特征;然后,使用经纬度信息通过具有噪声的基于密度的聚类(DBSCAN)算法提取空间区域热度特征,将这些特征组成特征向量来刻画用户活动语义;最后,采用集成学习方法中的XGBoost算法建立活动语义识别模型。在FourSquare的两个公共签到数据集上,基于联合特征的模型比基于时间特征的模型在识别准确率上提高了28个百分点,与上下文感知混合(CAH)方法和时空活动偏好(STAP)方法对比,所提方法的识别准确率分别提高了30个百分点和5个百分点。实验结果表明所提方法与对比方法相比在活动语义识别问题上更加准确有效。
|
关 键 词: | 时空数据 活动语义识别 空间热度 具有噪声的基于密度的聚类 极限梯度提升算法 |
收稿时间: | 2020-03-18 |
修稿时间: | 2020-06-19 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《计算机应用》浏览原始摘要信息 |
|
点击此处可从《计算机应用》下载全文 |
|