摘要
人工智能芯片是专门用于高效执行人工智能计算任务的芯片.中国电子科技集团公司第三十八所研制了一款针对边缘侧深度学习模型推理计算的人工智能芯片,主要面向雷达图像目标识别、色选机图像智能处理等应用.该芯片是一个异构的SOC芯片,由中央处理核心、神经网络加速核通过片上总线互联形成,峰值算力达到16TOPS(INT8).FCOS模型是一个先进的单阶段无锚框目标检测深度学习模型,该模型首次提出的核心原理已经被一些新的目标检测网络模型采用.该文研究FCOS深度学习模型在该人工智能芯片上的部署,并研究片上存储器大小、DDR带宽、DDR配置、算力、数据类型等因素对FCOS深度学习模型部署的性能和检测效果的影响.可以为深度学习模型部署技术研究人员、人工智能芯片设计人员提供参考.
基金项目
国家自然科学基金联合基金(企业创新发展联合基金)(U19B2041)