计算机技术与发展2023,Vol.33Issue(5) :96-104.DOI:10.3969/j.issn.1673-629X.2023.05.015

基于树莓派的高效卷积优化方法

Optimization Method of Efficient Convolution Based on Raspberry Pi

郭晓龙 牛晋宇 杜永萍
计算机技术与发展2023,Vol.33Issue(5) :96-104.DOI:10.3969/j.issn.1673-629X.2023.05.015

基于树莓派的高效卷积优化方法

Optimization Method of Efficient Convolution Based on Raspberry Pi

郭晓龙 1牛晋宇 1杜永萍1
扫码查看

作者信息

  • 1. 北京工业大学 信息学部,北京 100124
  • 折叠

摘要

针对卷积神经网络(CNN)的巨大参数量和计算量而导致在树莓派等低功耗的边缘设备模型推理过程中产生耗时较大的问题,对网络上现有的开源推理框架进行了深入研究及对比分析,发现这些都属于通用型推理框架,并不能针对树莓派设备进行极致推理优化.因此,提出了基于RoofLine模型的定量分析方法,从访存和运算二个维度对Mobilenet等移动端网络架构模型进行卷积推理优化.研究采用了计算图优化方法,利用算子融合和内存重排做推理预处理,从而减少推理过程的计算量和访存开销;同时针对每一层的卷积参数量和特性,提出了9宫格分块策略和NEON指令流水线级别的优化.实验表明,所提出的优化方法在不同的分辨率下,相比腾讯的开源框架NCNN、阿里MNN和商汤PPL.NN在推理速度上取得了高于3倍的性能优化.

关键词

深度学习模型推理加速/计算图优化/算子融合/卷积优化/移动端推理框架

引用本文复制引用

基金项目

国家重点研发计划(2018YFC1900804)

国家重点研发计划(2019YFC1906002)

出版年

2023
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量6
段落导航相关论文