用深度强化学习的方法实现频谱共享。频谱资源是一种有限资源。在自适应的实现频谱共享方面,DRL与频谱共享结合是一个十分有潜力的方向。
2023-04-19 09:21:27 942KB spectrumsharing 共享 深度强化学习 DRL
1
目前,大多数 DRL 模型事实上还停留在传统的博弈论层面,例如**纳什均衡或零和游戏**等。但随着DRL的发展,传统博弈论方法已经逐渐呈现出不足之处,而同时则有一些新的博弈论方法被纳入到人工智能的程序当中。雷锋网公众号介绍三种深刻影响 DRL 的「新」博弈论方法:平均场博弈(Mean Field Games,MFG);随机博弈(Stochastic games);进化博弈(Evolutionary Games,EGT)。本文是对公众号介绍文章的消化再整理:标注按字者,加注标签;关键地方,有粗体和下划线。适合快速而较系统的了解博弈发展状况的读者。
2023-04-08 01:04:46 11KB 深度强化学习DRL 博弈论
1