Rabit:可靠的Allreduce和广播接口
Rabit的最新发展已转移到。 请参阅讨论。
rabit是一个轻量级的库,提供Allreduce和Broadcast的容错接口。 它旨在支持分布式机器学习程序的轻松实现,其中许多自然属于Allreduce抽象。 rabit的目标是支持可移植,可伸缩且可靠的分布式机器学习程序。
您也可以直接读取
Rabit是支持分布式XGBoost的骨干库之一
特征
所有这些功能都来自有关小兔子的事实:)
便携式:兔子重量轻,无处不在
Rabit是一个库而不是框架,程序只需要链接该库即可运行
Rabit仅依靠大多数框架提供的启动程序的机制
您可以使用相同的代码在许多平台上运行rabit程序,包括Yarn(Hadoop),MPI
可扩展且灵活:rabit运行速度快Rabit程序使用Allreduce进行通信,并且不会在MapReduce抽象的迭代之间承受
2021-11-08 16:05:59
123KB
C++
1