国家学术搜索
登录
注册
中文
EN
计算机应用研究
2021,
Vol.
38
Issue
(12) :
3781-3785.
DOI:
10.19734/j.issn.1001-3695.2021.04.0152
基于视频描述和阅读理解的视频问答研究
Research on video question answering based on video description and reading comprehension
胡锦祥
孟朝晖
计算机应用研究
2021,
Vol.
38
Issue
(12) :
3781-3785.
DOI:
10.19734/j.issn.1001-3695.2021.04.0152
下载
引用
认领
✕
来源:
国家科技期刊平台
NETL
NSTL
维普
万方数据
基于视频描述和阅读理解的视频问答研究
Research on video question answering based on video description and reading comprehension
胡锦祥
1
孟朝晖
1
扫码查看
点击上方二维码区域,可以放大扫码查看
作者信息
1.
河海大学 计算机与信息学院,南京211100
折叠
摘要
针对大多数视频问答(VideoQA)模型将视频和问题嵌入到同一空间进行答案推理所面临的多模态交互困难、视频语义特征保留能力差等问题,提出了一种视频描述机制来获得视频语义特征的文本表示,从而避免了多模态的交互.提出方法将视频特征通过描述机制得到相应的视频描述文本,并将描述文本特征与问题特征进行阅读理解式的交互与分析,最后推理出问题的答案.在MSVD-QA以及MSRVTT-QA数据集上的测试结果显示,提出问答模型的回答准确率较现有模型均有不同程度的提升,说明所提方法能更好地完成视频问答任务.
关键词
视频问答
/
视频描述
/
阅读理解
引用本文
复制引用
出版年
2021
计算机应用研究
四川省电子计算机应用研究中心
计算机应用研究
CSTPCD
CSCD
北大核心
影响因子:
0.93
ISSN:
1001-3695
下载
引用
认领
参考文献量
3
段落导航
相关论文
摘要
关键词
引用本文
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果