基于OpenCL的TensorFlow框架中Element-Wise算子实现OA
Implementation of Element-Wise Operator in TensorFlow Framework Based on OpenCL
[目的]深度学习模型以较强的建模性能和优秀的多场景适应能力被广泛应用于各类典型人工智能领域.目前通常采用异构并行计算技术满足深度学习模型的算力需求,然而目前深度学习框架普遍使用CUDA或ROCm等编程模型,仅能支持特定厂商设备;对于通用异构计算设备,需要通过OpenCL编程标准实现支持,因此我们着力于实现TensorFlow框架的OpenCL版本.[方法]本文对TensorFlow框架中主要基于Eigen库提供的接口实现的Element-Wise…查看全部>>
隋轶丞;石昌青;孙羽菲;张玉志;陈禹乔;张宇哲
南开大学,软件学院,天津 300350南开大学,软件学院,天津 300350南开大学,软件学院,天津 300350先进计算与关键软件海河实验室,天津 300350南开大学,软件学院,天津 300350先进计算与关键软件海河实验室,天津 300350
OpenCLTensorFlow核函数
《数据与计算发展前沿》 2022 (3)
19-29,11
国家重点研发计划(2021YFB0300104)
评论