搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

Safe Reinforcement Learning with Linear Function Approximation

论文的word格式原论文地址：http://proceedings.mlr.press/v139/amani21a/amani21a.pdf 翻译：https://blog.csdn.net/baishuiniyaonulia/article/details/125504660，https://blog.csdn.net/baishuiniyaonulia/article/details/125572881

2022-07-02 16:08:43 835KB word 翻译论文 强化学习

1

基于ensp防火墙双击热备二层网络规划与设计(命令齐全)_参考文章_配置实验命令笔记

文件中包含了基于ensp防火墙双击热备二层网络规划与设计的topo图及其完整的配置（2份区别就是第二个加了无线网络规划设计(WIFI)）（二层架构，核心层、计入层），文件在加入了相应的配套文章连接，并加入了实验的笔记(防止链接失效如果拿到分享链接请尽快保存到自己的个人空间中)。文章中的综合运用设计技术的单个技术如vlan划分、静态路由、OSPF、单臂路由(trunk/access)、DHCP、无线WLAN、Snooping、MSTP、VRRP、防火墙、双击热备、DNS server、ACL、telnet等。该topo适合了解并熟知单个组网技术的小伙伴，并想学习将单个技术组合应用的小伙伴，使用场景适用于毕业设计、校园网络规划、企业网络规划等场合

2022-07-02 14:05:43 3.24MB 网络协议 强化学习 网络规划设计 网络安全

深度强化学习系列DQN

深度强化学习系列，包括最基础的DQN，DQN模型改进，DQN算法改进，分层DRL，基于策略梯度的深度强化学习等等

2022-06-30 18:10:51 72.23MB DQN

基于递阶强化学习的多智能体AGV 调度系统

递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。具有离散动态特性的
A GV 调度系统需要实时动态的调度方法, 而具有M axQ 递阶强化学习能力的多智能体通过高效的强化
学习方法和协作, 可以实现A GV 的实时调度。仿真实验证明了这种方法的有效性。

2022-06-28 14:30:45 311KB 递阶强化学习 M axQ 方法多智能体协作 A GV

1

Acc使用并行可微模拟加速策略学习.docx

2022-06-27 09:07:59 960KB 强化学习

1

berkeley-intro-to-artificial-intelligence:加州大学伯克利分校CS188人工智能入门-使用Pacman进行搜索和强化学习

2022-06-26 13:19:00 358KB Python

1

强化学习导论

强化学习导论，2018年1月完整版，Richard S. Sutton和 Andrew G. Barto所著

2022-06-25 11:09:33 12.26MB 强化学习

1

二级倒立摆极点最优配置.zip

1.本完档是我matlab实习的左右文档，包含源代码和讲解、试验采集的数据（用于神经网络的）、固高的用户手册等。 2.实验效果完美，我都是一次过，倒立摆稳得一笔。尤其是神经网络训练部分，设置拟合度为0.000001别人训练2000多次成功，我的数据只需要500次不到甚至更少！！！无论你的机器多老（考核时候用的是2006年的大屁股机器，这都2019年了，稳稳地可以用）。 3.我拟合度自己都设置到0.00000000000000000001，都成功过！！！！！！！！！

2022-06-21 16:45:57 1.89MB matlab 二级倒立摆 极点最优控制 神经网络

1

基于强化学习的适应性微粒群算法

惯性权重是微粒群算法(PSO) 的重要参数, 它可以平衡算法的全局和局部搜索能力的关系, 改善算法的性
能. 对此, 提出一种基于强化学习的适应性微粒群算法(RPSO). 首先将不同惯性权重调整策略视为粒子的行动集合;
然后通过计算??函数值, 考察粒子多步进化的效果; 进而选择粒子最优进化策略, 动态调整惯性权重, 以增强算法寻
找全局最优的能力. 对几种经典函数的测试结果表明, RPSO 能够获得良好的性能, 特别是对多峰函数效果更加明显.

2022-06-20 09:28:19 189KB 微粒群算法|惯性权重|自适应|强化学习

1

各种强化学习算法

2022-06-19 21:55:35 109KB 各种强化学习算法

1

个人信息

热门下载

最新下载

其他资源