计算机科学2021,Vol.48Issue(3) :87-96.DOI:10.11896/jsjkx.201200174

视觉问答与对话综述

Survey on Visual Question Answering and Dialogue

牛玉磊 张含望
计算机科学2021,Vol.48Issue(3) :87-96.DOI:10.11896/jsjkx.201200174

视觉问答与对话综述

Survey on Visual Question Answering and Dialogue

牛玉磊 1张含望1
扫码查看

作者信息

  • 1. 南洋理工大学计算机科学与工程学院 新加坡 639798
  • 折叠

摘要

视觉问答与对话是人工智能领域的重要研究任务,是计算机视觉与自然语言处理交叉领域的代表性问题之一.视觉问答与对话任务要求机器根据指定的视觉图像内容,对单轮或多轮的自然语言问题进行作答.视觉问答与对话对机器的感知能力、认知能力和推理能力均提出了较高的要求,在跨模态人机交互应用中具有实用前景.文中对近年来视觉问答与对话的研究进展进行了综述,对数据集和算法进行了归纳,对研究挑战和问题进行了总结,最后对视觉问答与对话的未来发展趋势进行了讨论.

关键词

视觉问答/视觉对话/视觉语言/视觉推理/深度学习

引用本文复制引用

基金项目

阿里巴巴-南洋理工大学新加坡联合研究所()

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
被引量10
参考文献量1
段落导航相关论文