视觉—语言—行为:视觉语言融合研究综述 |
| |
引用本文: | 李睿,郑顺义,王西旗.视觉—语言—行为:视觉语言融合研究综述[J].计算机应用研究,2020,37(11):3206-3212. |
| |
作者姓名: | 李睿 郑顺义 王西旗 |
| |
作者单位: | 武汉大学 遥感信息工程学院,武汉430079;武汉大学 遥感信息工程学院,武汉430079;武汉大学 遥感信息工程学院,武汉430079 |
| |
摘 要: | 通过语言给予智能体指示使其完成通用性的任务是人工智能领域的愿景之一。近年来有越多越多的学者试图通过融合计算机视觉与自然语言处理领域的相关技术以期实现此目标。为了及时跟进相关领域的研究,把握视觉与语言融合方向前沿,对于视觉—语言—行为最新进展进行综述。首先简单介绍了融合视觉与语言的弱耦合尝试,之后重点综述了视觉—语言—行为这一最新方向相关的视觉语言导航、具身问答及其相似研究,最后总结了制约此领域发展的关键问题及可能的解决方案。
|
关 键 词: | 计算机视觉 自然语言处理 深度学习 视觉语言导航 具身问答 |
收稿时间: | 2019/9/9 0:00:00 |
修稿时间: | 2020/9/25 0:00:00 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《计算机应用研究》浏览原始摘要信息 |
|
点击此处可从《计算机应用研究》下载全文 |
|