摘 要: | 针对当前视线估计方法准确率不高的问题,提出了一种基于残差网络与注意力机制相结合的视线估计模型。首先,预处理阶段对人脸图像进行关键点定位、剪裁及归一化;然后,将归一化后的图像连续通过残差网络与CBAM(convolutional block attention module)注意力模块,进行人脸特征提取;最后,将神经网络输出的二维视线方向向量转换为三维视线方向向量,得到最终结果。实验结果表明,本模型在公共数据集MPIIFaceGaze上的视线误差角度为4.48o,与其他视线估计系统模型进行对比,本文所提出的模型可以更准确地估计视线方向。
|