上传者: 42113794
|
上传时间: 2021-12-17 10:05:28
|
文件大小: 89KB
|
文件类型: -
使用Python的强化学习算法
这是Packt发行的《 的代码库。
学习,理解和开发用于应对AI挑战的智能算法
这本书是关于什么的?
强化学习(RL)是AI的流行和有前途的分支,涉及制作更智能的模型和代理,这些模型和代理可以根据不断变化的需求自动确定理想的行为。 本书将帮助您掌握RL算法并在构建自学习代理时了解其实现。 本书首先介绍了在RL环境中工作所需的工具,库和设置,然后介绍了RL的组成部分,并深入研究了基于价值的方法,例如Q学习和SARSA算法的应用。 您将学习如何结合使用Q学习和神经网络来解决复杂的问题。 此外,在继续使用DDPG和TD3确定性算法之前,您将研究策略梯度方法TRPO和PPO,以提高性能和稳定性。 本书还介绍了模仿学习技术的工作原理以及Dagger如何教代理人驾驶。 您将发现进化策略和黑盒优化技术,并了解它们如何改善RL算法。 最后,您将掌握诸如UCB和UCB1