上传者: 42165490
|
上传时间: 2022-01-03 18:50:49
|
文件大小: 33KB
|
文件类型: -
Distribution is all you need
Take-Away
笔者使用 PyTorch 编写了不同加速库在 ImageNet 上的使用示例(单机多卡),需要的同学可以当作 quickstart 将需要的部分 copy 到自己的项目中(Github 请点击下面链接):
简单方便的 nn.DataParallel
使用 torch.distributed 加速并行训练
使用 torch.multiprocessing 取代启动器
使用 apex 再加速
horovod 的优雅实现
GPU 集群上的分布式
补充:分布式
这里,笔者记录了使用 4 块 Tesla V100-PICE 在 ImageNet 进行了运行时间的测试,测试结果发现 Apex 的加速效果最好,但与 Horovod/Distributed 差别不大,平时可以直接使用内置的 Distributed。D