张浩宇、王天保、李孟择、赵洲、浦世亮、吴飞
浙江大学计算机与科学技术学院,杭州 310013
杭州海康威视数字技术股份有限公司,杭州 310051
多模态机器学习 视觉语言多模态 预训练 自监督学习 图像文本预训练 视频文本预训练
国家重点研发计划浙江省科技计划
2020YFC08325002022C01044
2022