FleetX

ps1

分布式训练概述

整体介绍与内容概览

如何设计分布式训练的搭建方案

公有云配置
K8S部署
安装Paddle与FleetX

前置基础配置

优化算法

配置分布式训练

Collective训练
ParameterServer训练

高阶内容

大规模蒸馏
自监督训练
弹性训练
FleetX扩展工具包

分布式训练FAQ

用户FAQ

FleetX

»
Collective训练
Edit on GitHub

Collective训练¶

Collective多卡分布式训练¶

1. 静态图分布式训练快速开始
2. 性能基准
3. 设计思想综述
4. 性能优化
5. 超大Batch训练
6. 模型并行
- 6.1. PLSC
- 6.2. 使用Sharding 训练超大模型
7. 流水线并行
8. 二次开发
9. 整体示例

Next Previous

© Copyright 2020, PaddlePaddle. Revision 9b98cf17.

Built with Sphinx using a theme provided by Read the Docs.