基于FPGA的卷积神经网络加速技术研究

薛慧敏 ¹李坤坤 ²眭畅豪¹

扫码查看

作者信息

1. 中国航空工业集团西安航空计算技术研究所陕西西安 710000
2. 中国人民解放军63660部队河南洛阳 471099
折叠

摘要

实现高性能且低功耗的神经网络功能具有重要的意义.为了让神经网络加速预测并使其高效节能,设计了卷积神经网络加速器.首先采集信息对训练好的CNN神经网络模型使用剪枝和量化对网络模型共同作用进行压缩;然后通过研究数据的存储方式、流动过程、CNN网络的层结构等多个模块分别提出优化方案;最后在Xilinx的UltraSacle+系列的ZCU102 板子上设计CNN网络加速器,使得所设计的加速器性能在前人的基础上有所改进.实验结果显示,CNN加速器的FPGA比CPU的计算速度提高了314.55 倍,比GPU的能量效率提高了 1.39 倍,为卷积网络模型加速器以及门控单元GRU网络等其他网络模型的加速提供了有效参考.

关键词

卷积神经网络/FPGA/硬件加速/模型压缩

引用本文复制引用

出版年

2024

信息技术与信息化

山东电子学会

信息技术与信息化

影响因子：0.29

ISSN：1672-9528

参考文献量11

段落导航