5.3. 使用LARS / LAMB 优化分布式超大batch 训练

  • TBA