深度双模态源域对称迁移学习的跨模态检索 |
| |
引用本文: | 刘秋杰,万源,吴杰.深度双模态源域对称迁移学习的跨模态检索[J].计算机应用,2024(1):24-31. |
| |
作者姓名: | 刘秋杰 万源 吴杰 |
| |
作者单位: | 武汉理工大学理学院 |
| |
基金项目: | 中央高校基本科研业务费专项资金资助项目(2021Ⅲ030JC)~~; |
| |
摘 要: | 基于深度网络的跨模态检索经常面临交叉训练数据不足的挑战,这限制了训练效果并容易导致过拟合。迁移学习在源域中训练数据的知识迁移学习到目标域中,能有效解决训练数据不足的问题。然而,现有的大部分迁移学习方法致力于将知识从单模态(如图像)源域迁移到多模态(如图像和文本)目标域,而如果源域中已存在多种模态信息,这样的非对称迁移会忽略源域中包含的潜在的模态间语义信息;同时这些方法不能很好地提取源域与目标域中相同模态的相似性,进而减小域差异。因此,提出一种深度双模态源域对称迁移学习的跨模态检索(DBSTL)方法。该方法旨在实现从双模态源域到跨模态目标域的知识迁移,并获得跨模态数据的公共表示。DBSTL由模态对称迁移子网和语义一致性学习子网构成。模态对称迁移子网采用混合对称结构,在知识迁移过程中,使模态间信息具有更高的一致性,并能减小源域与目标域间的差异;而语义一致性学习子网中,所有模态共享相同的公共表示层,并在目标域的监督信息指导下保证跨模态语义的一致性。实验结果表明,在Pascal、NUS-WIDE-10k和Wikipedia数据集上,所提方法的平均精度均值(mAP)较对比方法得到的最好结果分别提...
|
关 键 词: | 跨模态检索 迁移学习 双模态源域 语义一致性 |
|
|