FleetX
ps_doc
分布式训练概述
整体介绍与内容概览
如何设计分布式训练的搭建方案
1. 公有云配置
2. K8S部署
3. 安装Paddle与FleetX
前置基础配置
1. 优化算法
配置分布式训练
Collective训练
ParameterServer训练
1. 快速开始
2. 性能基准
3. 设计思想综述
性能优化
4. 增量训练
5. 流式训练
6. 分布式指标
7. 分布式预估
8. 二次开发
9. 整体示例
高阶内容
1. 大规模蒸馏
2. 自监督训练
3. 弹性训练
4. FleetX扩展工具包
分布式训练FAQ
1. 用户FAQ
FleetX
»
ParameterServer训练
Edit on GitHub
ParameterServer训练
¶
参数服务器分布式训练
¶
1. 快速开始
1.1. 实用样例
2. 性能基准
3. 设计思想综述
性能优化
1. 计算图拆分与优化
2. 梯度融合策略与优化
3. 通信设计
4. 存储设计
5. 数据读取
6. 低频通信参数服务器训练算法
4. 增量训练
4.1. 简介
4.2. 原理介绍
4.3. 功能效果
4.4. 使用方法
4.5. 运行成功提示
4.6. 常见问题与注意事项
4.7. 论文/引用
5. 流式训练
5.1. 简介
5.2. 原理介绍
5.3. 功能效果
5.4. 使用方法
5.5. 运行成功提示
5.6. 常见问题与注意事项
5.7. 论文/引用
6. 分布式指标
6.1. 简介
6.2. 原理
6.3. 分布式指标
6.4. 使用方法
7. 分布式预估
7.1. 简介
7.2. 原理
7.3. 使用方法
8. 二次开发
9. 整体示例