基于ARM+FPGA异构平台的目标检测加速模块设计与实现OA北大核心CSCDCSTPCD
为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题,以YOLO目标检测模型为例,设计实现基于ARM+FPGA异构平台的目标检测加速模块。该系统使用剪枝、量化后的压缩模型,在FPGA实现神经网络前向推理加速,在ARM中实现加速器调度。实验结果表明,部署至Xilinx ZCU102开发板上,该模块在200 MHz工作频率下,平均计算性能达到425.8 GOP/s,推理压缩模型速度达到30.3 fps,模块功耗为3.56 W,证明该加速模块具备可配置性。
李放;曹健;李普;谢豪;赵雄波;王源;张兴
北京大学软件与微电子学院,北京102600北京大学软件与微电子学院,北京102600北京大学软件与微电子学院,北京102600北京大学软件与微电子学院,北京102600北京航天自动控制研究所,北京100070北京大学集成电路学院,北京100871北京大学软件与微电子学院,北京102600
计算机与自动化
深度学习目标检测模型剪枝量化异构平台边缘计算
《北京大学学报:自然科学版》 2022 (6)
P.1035-1041,7
国家重点研发计划项目(2018YFE0203801)资助。
评论