摘要
实现高性能且低功耗的神经网络功能具有重要的意义.为了让神经网络加速预测并使其高效节能,设计了卷积神经网络加速器.首先采集信息对训练好的CNN神经网络模型使用剪枝和量化对网络模型共同作用进行压缩;然后通过研究数据的存储方式、流动过程、CNN网络的层结构等多个模块分别提出优化方案;最后在Xilinx的UltraSacle+系列的ZCU102 板子上设计CNN网络加速器,使得所设计的加速器性能在前人的基础上有所改进.实验结果显示,CNN加速器的FPGA比CPU的计算速度提高了314.55 倍,比GPU的能量效率提高了 1.39 倍,为卷积网络模型加速器以及门控单元GRU网络等其他网络模型的加速提供了有效参考.