Optimizing Federated Learning on Non-IID Data with Reinforcement

pytorch pytorch

，机器学习应用程序的广泛部署激发了人们对利用存储在移动设备上的大量数据的兴趣。为了保护数据隐私，联邦学习被提出通过在参与设备上执行本地分布式训练并将本地模型聚合为全局模型来学习共享模型。然而，由于移动设备的网络连接有限，联邦学习在所有参与设备上并行执行模型更新和聚合是不切实际的。此外，跨所有设备的数据样本通常不是独立同分布的(IID)，这对联邦学习的收敛性和速度提出了额外的挑战。在本文中，我们提出了一个经验驱动的控制框架FAVOR，它可以智能地选择客户端设备参与每一轮联邦学习，以抵消非iid数据引入的偏差，并加快收敛速度。通过实证和数学分析，我们观察到设备上训练数据的分布与基于这些数据训练的模型权值之间存在隐式联系，这使我们能够根据该设备上上传的模型权值来描述该设备上的数据分布。然后，我们提出了一种基于深度q学习的机制，该机制学习在每个通信轮中选择一个设备子集，以最大限度地奖励，鼓励提高验证准确性，并惩罚使用更多通信轮。通过在PyTorch中进行的大量实验，我们表明，与联邦平均算法相比，联邦学习所需的通信轮数在MNIST数据集上最多可以减少49%。

文件下载

评论信息

其他资源

免责申明

【只为小站】的资源来自网友分享，仅供学习研究，请务必在下载后24小时内给予删除，不得用于其他任何用途，否则后果自负。基于互联网的特殊性，【只为小站】无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查；无论【只为小站】经营者是否已进行审查，用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场，基于网友分享，根据中国法律《信息网络传播权保护条例》第二十二条之规定，若资源存在侵权或相关问题请联系本站客服人员，zhiweidada#qq.com，请把#换成@，本站将给予最大的支持与配合，做到及时反馈和处理。关于更多版权及免责申明参见版权及免责申明

Optimizing Federated Learning on Non-IID Data with Reinforcement

文件下载

评论信息

其他资源

免责申明

个人信息

相关资源标签

热门下载

最新下载