首页 | 本学科首页   官方微博 | 高级检索  
     

特征注意力Transformer模块在3D唇语序列身份识别中的应用
引用本文:骈鑫洋,王瑜,张洁.特征注意力Transformer模块在3D唇语序列身份识别中的应用[J].计算机工程与应用,2024(7):141-146.
作者姓名:骈鑫洋  王瑜  张洁
作者单位:1. 北京工商大学人工智能学院;2. 北京科技大学自动化学院
基金项目:北京市自然科学基金-北京市教育委员会科技计划重点项目(KZ202110011015);;国家自然科学基金(61906004);
摘    要:唇语行为是一种新兴起的生物特征识别技术,三维(three-dimensional,3D)唇语点云序列因包含真实嘴唇空间结构和运动信息,已成为个体身份识别的重要生物特征。但是,3D点云的无序与非结构化的特点导致时空特征的提取非常困难。为此,提出一种深度学习网络模型,用于3D唇语序列身份识别。该网络采用四层改进的PointNet++作为网络骨干,以分层方式抽取特征,为了学习到更多包含身份信息的时空特征,设计一种动态唇特征注意力Transformer模块,连接于PointNet++网络每一层之后,可以学习到不同特征图之间的相关信息,有效捕捉视频序列不同帧的上下文信息。与其他注意力机制构建的Transformer相比,提出的Transformer模块具有较少的参数,在S3DFM-FP和S3DFM-VP数据集上进行的实验表明,提出网络模型在3D唇语点云序列的身份识别任务中效果显著,即使在不受姿态约束的S3DFM-VP数据集中也表现出良好的性能。

关 键 词:说话人识别  Transformer  PointNet++  三维唇语点云
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号