面向两级多中心架构的深度学习平台设计与实现OA北大核心CSTPCD
大型企业的深度学习工作存在管理散乱和大量重复建设的问题。为了支持大规模深度学习的全过程管理和模型成果的高效复用,以国家电网公司的两级多中心部署架构为背景,提出一种深度学习平台。系统将训练、推理、数据和模型的管理工作分布在不同中心完成,彼此间协同完成深度学习的闭环。构建基于Kubernetes的私有云来支撑大批量深度学习应用的并行计算。前端界面采用基于算子的流程编排实现建模可视化和功能的可扩展。实验结果表明系统能够支持多个深度学习任务的并行,且额外的性能开销是可以接受的。
程仲汉;
福建警察学院计算机与信息安全管理系,福建福州350007
计算机与自动化
深度学习平台两级部署多中心Kubernetes容器云流程编排
《计算机应用与软件》 2024 (003)
P.16-21,48 / 7
福建省中青年教师教育科研项目(JAT200379)。
评论