集成层级图注意力网络检测非均衡虚假评论 |
| |
作者姓名: | 赵敏 张月琴 窦英通 张泽华 |
| |
作者单位: | 1. 太原理工大学信息与计算机学院;2. Department of Computer Science, University of Illinois at Chicago |
| |
基金项目: | 国家自然科学基金(61503273,61702356);;教育部产学合作协同育人项目;;山西省回国留学人员科研资助项目~~; |
| |
摘 要: | 作为机器学习当前一大热点,图神经网络(GNN)模型近年来已逐渐开始结合用户评论应用于欺诈检测领域。但现实中汇总的用户评论涉及多个不同领域,可用信息复杂多样,海量的用户生成内容中欺诈信息通常也只占少数,基于GNN的相关检测方法对虚假评论的识别效果不甚理想。针对这种特征异构和数据分布不均衡的问题,将评论系统进行异构网络建模,提出一种新的集成层次图注意力网络(En-HGAN)识别方法。通过融合层次注意力结构,更加充分地利用异构网络中丰富的用户行为信息,为评论学习更加丰富的语义表征,并在集成学习Bagging框架下集成多个差异化的HGAN子模型,使用随机欠采样策略实现基学习器多样性聚合,从而减少有效信息丢失,增强对欺诈评论的检测能力。在YelpChi与Amazon真实数据集上的实验结果表明,En-HGAN方法具有良好的异常探测性能,和当前一些最新的方法相比,在数据类别倾斜分布的应用中显示En-HGAN方法对欺诈实体具有不错的鲁棒性。
|
关 键 词: | 虚假评论检测 层次图注意力网络 网络表征学习 集成学习 非均衡数据分类 |
|