电路课设,RC、RL一阶暂态分析,CAA课程设计,pspice仿真
2021-07-02 20:24:27 2.96MB 电路课设 电路CAA课程设计 RC RL
1
强化学习和最优控制的《十个关键点》81页PPT汇总。本实验室主要面向于深度强化学习领域,分享包括但不限于深度强化学习Environment、理论推导与算法实现、前沿技术与论文解读、开源项目、应用场景、业界资讯等,同时包括基础数学、经典控制、博弈论、交叉学科等领域知识。
2021-07-01 16:47:15 4.83MB RL
1
HVAC-RL-控制 eplus-env EnergyPlus环境位于src / core / eplus-env中
2021-06-29 16:03:11 1.55GB HTML
1
基于模型的强化学习(MBRL)最近获得了极大的兴趣,因为它具有潜在的样本效率和合并非策略数据的能力。然而,使用富函数逼近器设计稳定、高效的MBRL算法仍然具有挑战性。
2021-06-26 11:02:26 3.96MB RL
1
CORE_RL_wand_.dll 动态链接库
2021-06-24 11:45:01 816KB CORERLwand
1
深入浅出强化学习:原理入门 《深入浅出强化学习:原理入门》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。 除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,《深入浅出强化学习:原理入门》既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。
2021-06-20 19:07:56 34.06MB RL
1
布尔代数——高等学校教学参考书,是数理逻辑、计算机等学科的必读的基础知识。
2021-06-18 14:57:23 1.67MB 开关代数、真假演算
1
RL-MPE 用DDPG/MADDPG/DQN/MADDPG+advantage实验 OpenAI开源的MPE环境 OpenAI MPE: OpenAI MADDPG: 自己加入了DQN,与Maddpg+advantage算法。但效果不如Maddpg。另,在游戏中设置了“吃掉消失”的现象。但训练策略与游戏得分有较大的关系,增加“吃掉消失”与“输赢”评判之后,训练效果不佳。
2021-06-17 18:12:37 52KB Python
1
文件中包含EMERGENT-TOOL-USE-FROM-MULTI-AGENT论文,以及论文的译文,附赠论文代码,可自行配置环境进行学习
2021-06-15 10:16:43 84.9MB openAI RL 人工智能 捉迷藏
1
RLTrader 代理学习使用 RL 方法进行交易 依赖关系 matplotlib
2021-06-10 20:03:45 11KB Python
1