基于张量虚拟机的快速卷积自动性能优化OA
卷积神经网络作为深度学习的典型代表,是计算机视觉等任务中最常用的神经网络,然而,卷积运算通常占整个卷积神经网络运行时的90%以上,成为卷积神经网络的性能瓶颈。此外,由于当下硬件的复杂性及工作负载的多样性,之前工作中的一些特定优化往往缺乏性能可移植性。对此,作者提出BlazerML,一个基于张量虚拟机(TVM)模板代码自动生成的开源卷积计算库,可为任何输入形状自动生成高性能的卷积实现。BlazerML是基于Winograd算法实现的,因为该算法是快…查看全部>>
陈疆;朱泓霖;孟金涛;魏彦杰
南方科技大学,深圳518055 中国科学院深圳先进技术研究院,深圳518055 深圳市腾讯计算机系统有限公司,深圳518063深圳市腾讯计算机系统有限公司,深圳518063中国科学院深圳先进技术研究院,深圳518055中国科学院深圳先进技术研究院,深圳518055
计算机与自动化
深度学习卷积神经网络快速卷积算法Winograd算法TVM自动性能优化
《集成技术》 2024 (5)
P.3-18,16
广东省重点领域研发计划资助项目(2021B0101310002)国家自然科学基金项目(62272449)深圳市基础研究项目(RCYX20200714114734194,KQTD20200820113106007,ZDSYS20220422103800001)中国科学院青年创新促进会项目(Y2021101)。