首页|期刊导航|高技术通讯|IR-GCN:二值图卷积神经网络推理加速器

IR-GCN:二值图卷积神经网络推理加速器OA北大核心CSTPCD

中文摘要

针对图卷积神经网络(GCN)中数据规模庞大、不适合边缘端低功耗处理器高效推理计算的问题,本文提出一种将新型二值数据量化算法(IR-Net)应用于GCN模型推理计算的方法,并设计了对应的硬件加速器IR-GCN。同时,针对计算过程中工作负载分布不均衡的问题,实现了一种负载均衡模块设计,显著提高了计算效率。实验结果表明,在较小精度损失范围内,IR-GCN加速器可以同时降低计算延迟以及访存开销。与现有性能最优的研究相比,IR-GCN加速器平均具有2.4倍的计算加速比、7.9倍的功耗降低、13.7倍的芯片面积减少以及21.0倍的访存量降低。

于启航;文渊博;杜子东

中国科学院计算技术研究所处理器芯片国家重点实验室,北京100190 中国科学院大学,北京100049中国科学院计算技术研究所处理器芯片国家重点实验室,北京100190中国科学院计算技术研究所处理器芯片国家重点实验室,北京100190

计算机与自动化

图卷积神经网络(GCN)二值神经网络(BNN)硬件加速器

《高技术通讯》 2024 (10)

P.1024-1035,12

国家重点研发计划(2022YFB4501601)国家自然科学基金(62222214,61925208,U19B2019,U22A2028)中国科学院稳定支持基础研究领域青年国家团队计划(YSBR-029)资助项目。

10.3772/j.issn.1002-0470.2024.10.002

评论