| 注册
首页|期刊导航|电子学报|面向Transformer模型边缘端部署的常用激活函数高精度轻量级量化推理方法

面向Transformer模型边缘端部署的常用激活函数高精度轻量级量化推理方法

杨赟辉 程虎 魏敬和 刘国柱 桑贤侦

电子学报2024,Vol.52Issue(10):P.3301-3311,11.
电子学报2024,Vol.52Issue(10):P.3301-3311,11.DOI:10.12263/DZXB.20240435

面向Transformer模型边缘端部署的常用激活函数高精度轻量级量化推理方法

杨赟辉 1程虎 1魏敬和 1刘国柱 1桑贤侦1

作者信息

  • 1. 中国电子科技集团公司第五十八研究所,江苏无锡214072
  • 折叠

摘要

关键词

Transformer/全量化推理/GELU函数/Swish函数/分段二次多项式拟合

分类

信息技术与安全科学

引用本文复制引用

杨赟辉,程虎,魏敬和,刘国柱,桑贤侦..面向Transformer模型边缘端部署的常用激活函数高精度轻量级量化推理方法[J].电子学报,2024,52(10):P.3301-3311,11.

基金项目

江苏省自然科学基金(No.K20211041,No.BK20211040,No.BE2021003-1,No.BE2023005-1) (No.K20211041,No.BK20211040,No.BE2021003-1,No.BE2023005-1)

国家自然科学基金(No.62174150)。 (No.62174150)

电子学报

OA北大核心CSTPCD

0372-2112

访问量0
|
下载量0
段落导航相关论文