首页|期刊导航|北京大学学报:自然科学版|基于ARM+FPGA异构平台的目标检测加速模块设计与实现

基于ARM+FPGA异构平台的目标检测加速模块设计与实现OA北大核心CSCDCSTPCD

中文摘要

为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题,以YOLO目标检测模型为例,设计实现基于ARM+FPGA异构平台的目标检测加速模块。该系统使用剪枝、量化后的压缩模型,在FPGA实现神经网络前向推理加速,在ARM中实现加速器调度。实验结果表明,部署至Xilinx ZCU102开发板上,该模块在200 MHz工作频率下,平均计算性能达到425.8 GOP/s,推理压缩模型速度达到30.3 fps,模块功耗为3.56 W,证明该加速模块具备可配置性。

李放;曹健;李普;谢豪;赵雄波;王源;张兴

北京大学软件与微电子学院,北京102600北京大学软件与微电子学院,北京102600北京大学软件与微电子学院,北京102600北京大学软件与微电子学院,北京102600北京航天自动控制研究所,北京100070北京大学集成电路学院,北京100871北京大学软件与微电子学院,北京102600

计算机与自动化

深度学习目标检测模型剪枝量化异构平台边缘计算

《北京大学学报:自然科学版》 2022 (6)

P.1035-1041,7

国家重点研发计划项目(2018YFE0203801)资助。

10.13209/j.0479-8023.2022.089

评论

您当前未登录!去登录点击加载更多...