首页|transformer在底层视觉应用上的发展综述

transformer在底层视觉应用上的发展综述

扫码查看
transformer,一种基于自注意机制的序列网络,首次被引入到自然语言处理范畴.由于其强大的长距离特征表示能力以及高性能和对视觉特定感应偏差的需求减少,基于transformer的模型被广泛应用于计算机视觉任务.在各种视觉基准测试中,基于transformer模型性能类似于或优于其他类型的网络,如卷积神经网络和递归神经网络.首先讨论基于transformer的不同底层视觉任务;然后分析了它们的优缺点;最后,总结了视觉transformer存在的问题,并提供了进一步的研究方向.

屠红艳、管其杰

展开 >

上海电力大学 上海 201306

华东送变电工程有限公司 上海 201803

transformer 计算机视觉 深度学习 图像生成

2024

信息技术与信息化
山东电子学会

信息技术与信息化

影响因子:0.29
ISSN:1672-9528
年,卷(期):2024.(2)
  • 37