matlab贪婪算法代码使用强化学习进行内容缓存
众所周知,无线移动终端网络中的最佳数据分配问题即使对于少量的文件和终端(NP-Hard)也是难以解决的。
该存储库包含在
IEEE
Xplore:
Distributed
Caching
based
on
Decentralized
Learning
Automata
中发表的工作代码。
问题
简单地说,文件放置问题或“缓存问题”出现在我们想要在每个位置最多
C
个对象的
H
位置中找到
F
个对象的最佳放置时。
最优指的是最小化某种成本函数的分配,在这种情况下是网络中的延迟。
尝试所有可能的对象组合和排列(“蛮力”或“穷举搜索”方法)对于少量对象很快变得不可行。
解决方案
有很多方法可以解决缓存问题的次优解决方案。
我们提出了一个受到独立玩家游戏(学习自动机)的启发,他们采取行动并感知彼此的选择,以了解他们的策略是否好。
由于不需要对玩家的选择进行评分的中心化实体,因此这种方法具有高度的可扩展性。
在模拟的嘈杂环境下,我们的算法接近贪婪策略的性能,其中每个玩家都最小化他们的成本函数。
我们提出了一种离散广义追踪算法(DGPA
贡献
基
2023-01-03 15:39:19
6.68MB
系统开源
1