视觉—语言—行为：视觉语言融合研究综述期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

视觉—语言—行为：视觉语言融合研究综述

引用本文：	李睿,郑顺义,王西旗.视觉—语言—行为：视觉语言融合研究综述[J].计算机应用研究,2020,37(11):3206-3212.

作者姓名：	李睿郑顺义王西旗

作者单位：	武汉大学遥感信息工程学院,武汉430079;武汉大学遥感信息工程学院,武汉430079;武汉大学遥感信息工程学院,武汉430079

摘要：	通过语言给予智能体指示使其完成通用性的任务是人工智能领域的愿景之一。近年来有越多越多的学者试图通过融合计算机视觉与自然语言处理领域的相关技术以期实现此目标。为了及时跟进相关领域的研究，把握视觉与语言融合方向前沿，对于视觉—语言—行为最新进展进行综述。首先简单介绍了融合视觉与语言的弱耦合尝试，之后重点综述了视觉—语言—行为这一最新方向相关的视觉语言导航、具身问答及其相似研究，最后总结了制约此领域发展的关键问题及可能的解决方案。
关键词：	计算机视觉自然语言处理深度学习视觉语言导航具身问答
收稿时间：	2019/9/9 0:00:00
修稿时间：	2020/9/25 0:00:00
本文献已被万方数据等数据库收录！
	点击此处可从《计算机应用研究》浏览原始摘要信息
	点击此处可从《计算机应用研究》下载全文