余宙、俞俊、朱俊杰、匡振中
杭州电子科技大学计算机学院复杂系统建模与仿真教育部重点实验室,杭州 310018
场景文本视觉问答 知识表征 注意力机制 Transformer 多模态融合
国家重点研发计划国家自然科学基金国家自然科学基金浙江省自然科学基金浙江省自然科学基金
2020YFB14067016207214762125201LR22F020001LY22F020028
2022