信息技术与信息化2024,Issue(2) :47-51,57.DOI:10.3969/j.issn.1672-9528.2024.02.011

transformer在底层视觉应用上的发展综述

屠红艳 管其杰
信息技术与信息化2024,Issue(2) :47-51,57.DOI:10.3969/j.issn.1672-9528.2024.02.011

transformer在底层视觉应用上的发展综述

屠红艳 1管其杰2
扫码查看

作者信息

  • 1. 上海电力大学 上海 201306
  • 2. 华东送变电工程有限公司 上海 201803
  • 折叠

摘要

transformer,一种基于自注意机制的序列网络,首次被引入到自然语言处理范畴.由于其强大的长距离特征表示能力以及高性能和对视觉特定感应偏差的需求减少,基于transformer的模型被广泛应用于计算机视觉任务.在各种视觉基准测试中,基于transformer模型性能类似于或优于其他类型的网络,如卷积神经网络和递归神经网络.首先讨论基于transformer的不同底层视觉任务;然后分析了它们的优缺点;最后,总结了视觉transformer存在的问题,并提供了进一步的研究方向.

关键词

transformer/计算机视觉/深度学习/图像生成

引用本文复制引用

出版年

2024
信息技术与信息化
山东电子学会

信息技术与信息化

影响因子:0.29
ISSN:1672-9528
参考文献量37
段落导航相关论文