计算机研究与发展2022,Vol.59Issue(6) :1181-1191.DOI:10.7544/issn1000-1239.20200985

面向GPU计算平台的神经网络卷积性能优化

Performance Optimization of Neural Network Convolution Based on GPU Platform

李茂文 曲国远 魏大洲 贾海鹏
计算机研究与发展2022,Vol.59Issue(6) :1181-1191.DOI:10.7544/issn1000-1239.20200985

面向GPU计算平台的神经网络卷积性能优化

Performance Optimization of Neural Network Convolution Based on GPU Platform

李茂文 1曲国远 2魏大洲 2贾海鹏1
扫码查看

作者信息

  • 1. 中国科学院计算技术研究所 北京 100190
  • 2. 中国航空无线电电子研究所 上海 200241
  • 折叠

摘要

图像检测、识别任务已经被应用在越来越多的生产生活场景中,基于卷积神经网络的方法凭借着精度高的特点被广泛应用.但是卷积神经网络存在着权重参数多、对算力要求高的问题,算力有限且型号多样的边缘计算设备使得这些应用在使用中受限.在跨平台上运行高性能代码,以及基于GPU的卷积神经网络优化愈发重要.针对卷积神经网络中的卷积规模和其他通用矩阵乘(general matrix multiplication,GEMM)方法的不足,根据分块规模、分支执行、访存和计算比例,提出了 一种针对卷积神经网络规模优化的GEMM优化方法,将其应用于Winograd算法,并结合算子合并,实现对卷积进一步优化.同时基于遍历的自调优选择性能最优的卷积算子,结合离线编译、内存池、16 b量化、网络规模裁剪等方法,来提升卷积神经网络的性能.最后在AMD V1605B平台上进行实验验证算法的效果,通过和其他GEMM算法以及深度学习网络的性能进行对比,验证了该方法能够获得比GEMM算法和Winograd算法更好的加速效果,并能有效地加速卷积神经网络.

关键词

通用矩阵乘/Winograd算法/卷积神经网络/性能优化/GPU

引用本文复制引用

基金项目

国家重点研发计划(2107YFB0202105)

国家重点研发计划(2016YFB0200803)

国家重点研发计划(2017YFB0202302)

国家自然科学基金(61972376)

北京市自然科学基金(L182053)

出版年

2022
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量3
参考文献量17
段落导航相关论文