首页|基于昇腾AI处理器的非局部跨区域注意力模型研究与优化

基于昇腾AI处理器的非局部跨区域注意力模型研究与优化

朱燕

基于昇腾AI处理器的非局部跨区域注意力模型研究与优化

朱燕1
扫码查看

作者信息

  • 1. 浙江大学
  • 折叠

摘要

深度学习模型的研究给我国人工智能发展带来了新的机遇与挑战。硬件方面,没有完全掌握快速运算设备的核心技术,对此,华为针对深度学习研发出了专用处理器——昇腾AI处理器;软件方面,模型训练耗时长,且无法直接利用昇腾AI处理器提供的算力进行运算。针对以上情况,本文以CSNLA模型为例,旨在提升CSNLA模型在昇腾AI处理器上的精度和性能,进行以下工作: 首先,完善中间件CANN软件栈中的算子生态圈。一方面,使用DSL和TVM实现算子计算,针对DSL的已有接口,对norm_except_dim算子提出指数结合对数运算的方式替换幂运算的方式;另一方面,增加昇腾AI处理器对PyTorch框架中min算子的支持,在完成对其数据校验之后,映射到CANN软件栈中。 其次,在昇腾910处理器上提升CSNLA模型性能。利用混合精度、分布式计算、绑核与算子优化四种方式提升CSNLA模型在昇腾910处理器上的运算速度,使模型训练性能提升约17倍。 然后,在昇腾910处理器上提升CSNLA模型精度。在模型层面,通过数据“洗牌”、格式转换、CPU协同运算,提升模型训练精度。另外,规范化模型训练,提高该模型的可扩展性。 最后,在昇腾310处理器上实现CSNLA模型的离线推理。将已完成训练的CSNLA模型应用到已做好切分的Set5数据集上,并通过数据后处理计算推理精度和性能,拓展移动端的模型应用。

关键词

计算机视觉/超分辨率/昇腾AI处理器/数据处理

引用本文复制引用

授予学位

硕士

学科专业

电子信息-计算机技术

导师

梁秀波/杭志

学位年度

2023

学位授予单位

浙江大学

语种

中文

中图分类号

TP
段落导航相关论文