首页|基于特征分布调整的深度神经网络二值量化方法

基于特征分布调整的深度神经网络二值量化方法

扫码查看
二值卷积神经网络(BNNs)由于其占用空间小、计算效率高而受到关注。但由于量化激活特征的正负部分分布不均等问题,二值网络和浮点深度神经网络(DNNs)之间存在着明显的性能差距,影响了其在资源受限平台上的部署。二值网络性能受限的主要原因是特征离散性造成的信息损失以及分布优化不当造成的语义信息消失。针对此问题,应用特征分布调整引导二值化,通过调整特征的均值方差均衡特征分布,减小离散性造成的信息损失。同时,通过分组激励与特征精调模块设计,调整优化量化零点位置,均衡二值化激活分布,最大程度保留语义信息。实验表明,所提出方法在不同骨干网络、使用不同数据集时均能取得较好效果,其中在CIFAR-10上使用ResNet-18网络量化后网络准确率仅损失0。4%,高于当前主流先进二值量化算法。

刘畅、陈莹

展开 >

江南大学轻工过程先进控制教育部重点实验室,江苏无锡 214122

特征分布 均值方差调整 语义信息保留 模型压缩 二值神经网络 模型量化

国家自然科学基金

62173160

2024

控制与决策
东北大学

控制与决策

CSTPCD北大核心
影响因子:1.227
ISSN:1001-0920
年,卷(期):2024.39(6)
刘畅,陈莹.基于特征分布调整的深度神经网络二值量化方法[J].控制与决策,2024,39(6):1840-1848.DOI:10.13195/j.kzyjc.2022.1945.