筛选

AI 模型 × 基础设施

引擎与熔炉:在超级计算机上构建定制化的 PyTorch 框架

9月13日

10:50 - 11:25

地点: 会场4-338

这是为构建者、架构师和基础设施专家准备的深度探讨。我们将带领听众踏上深入Bielik.AI项目核心的技术之旅。我们从"引擎"开始:我们专为超级计算机环境构建的定制PyTorch框架。本次演讲探讨在超级计算基础设施上适配PyTorch进行大规模分布式训练所涉及的架构决策、优化策略和工程挑战。我们研究性能瓶颈、内存管理策略,以及将深度学习工作负载扩展到数千个计算节点的实际考虑因素。

讲师