搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

SDN_DDoS_Simulation：使用强化学习来检测和阻止DDoS攻击的尝试。仿真是使用Mininet完成的-源码

软件定义网络中的DDoS仿真该项目旨在为使用深度强化学习的DDoS缓解提供基本框架。该网络使用Mininet（基于软件定义网络）实现。入门克隆存储库 git clone https://github.com/santhisenan/SDN_DDoS_Simulation.git 先决条件安装依赖项安装Mininet 安装OpenVSwitch 安装Ryu 安装Tensorflow 安装Keras 克隆ryu存储库并将ryu / ryu文件夹复制到SDN_DDoS_Simulation根目录测验根据测试目的修改simple_tree_top.py cd SDN_DDo

2021-06-28 08:24:20 878KB reinforcement-learning tensorflow sdn ryu

1

Matlab强化学习_网格迷宫问题_Sarsa算法

MATLAB强化学习代码包，用于解决多步决策模型（网格迷宫问题）的Sarsa算法。编程与算法的详细说明可参看我的专栏：https://blog.csdn.net/weixin_43723517/category_9676083.html "I thought what I'd do was I'd pretend I was one of those deaf-mutes, or should I?"

2021-06-27 23:20:29 2KB matlab 强化学习 机器学习 Sarsa算法

1

Matlab强化学习_网格迷宫问题_QLearning算法

MATLAB强化学习代码包，用于解决多步决策模型（网格迷宫问题）的Q-Learning算法。编程与算法的详细说明可参看我的专栏：https://blog.csdn.net/weixin_43723517/category_9676083.html "I thought what I'd do was I'd pretend I was one of those deaf-mutes, or should I?"

2021-06-27 23:03:51 2KB matlab 强化学习 机器学习 Q-Learning

1

QL-1DIM.mlx

莫烦编程QL一维寻宝程序（Python改MATLAB实现）

2021-06-27 19:04:10 6KB 强化学习 matlab

1

SARSA 强化学习：使用 SARSA 解迷宫，强化学习-matlab开发

参考 6.4 (Sarsa: On-Policy TD Control), Reinforcement learning: An Introduction, RS Sutton, AG Barto, MIT press 在这个演示中，强化学习技术 SARSA 解决了两个不同的迷宫。 State-Action-Reward-State-Action (SARSA) 是一种用于学习马尔可夫决策过程策略的算法，用于强化学习。 SARSA，动作价值函数的更新： Q(S{t}, A{t}) := Q(S{t}, A{t}) + α*[ R{t+1} + γ ∗ Q(S{t+1}, A{ t+1}) − Q(S{t}, A{t}) ] 学习率 (α) 学习率决定了新获取的信息在多大程度上覆盖旧信息。因子为 0 将使代理不学习任何东西，而因子为 1 将使代理仅考虑最近的信息。折扣系数 (γ)

2021-06-27 13:54:05 118KB matlab

1

Reinforcement Learning An Introduction引言部分摘录-强化学习与监督学习无监督学习的区别.pdf

《强化学习导论》摘录之强化学习与有监督学习、监督学习的区别； Reinforcement Learning: An Introduction； The differences between reinforcement learning and supervised learning, unsupervised learning.

2021-06-26 21:06:10 1.71MB 机器学习 监督学习 无监督学习 强化学习

1

基于模型的强化学习的博弈论框架

基于模型的强化学习(MBRL)最近获得了极大的兴趣，因为它具有潜在的样本效率和合并非策略数据的能力。然而，使用富函数逼近器设计稳定、高效的MBRL算法仍然具有挑战性。

2021-06-26 11:02:26 3.96MB RL

1

求解部分可观测马氏决策过程的强化学习算法

针对部分可观测马氏决策过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策略可能发生振荡的现象, 研究了一种基于记忆的强化学习算法——CPnSarsa (K) 学习算法来解决该问题. 它通过重新定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.

2021-06-25 14:28:18 339KB 强化学习部分可观测M arkov 决策过程 Sarsa 学习无记忆策略

1

一种基于改进阈值函数的小波阈值降噪算法

针对小波阈值降噪中硬阈值函数和软阈值函数的不足，结合现有文献提出一种新的阈值函数。新阈值函数克服了传统阈值函数的缺点，保证了阈值函数的连续性，同时可以通过改变参数灵活地调节函数。在新阈值函数的基础上结合改进的阈值确定方法，提出一种新的降噪算法。通过MATLAB仿真，对几种小波降噪算法进行了试验分析，利用信噪比和均方根误差两个指标进行评价。结果表明，相比于传统的降噪算法，新降噪算法取得了更好的降噪效果。

2021-06-25 11:05:57 156KB 小波降噪

1

基于Matlab的电动汽车主动安全避撞控制.pdf

为提高电动汽车的安全性,详细分析了电动汽车纵向控制过程,构建了车辆安全距离模型,结合实际避撞需求设计了纵向控制器,并利用Matlab软件对设计的电动汽车主动安全避撞控制方法进行仿真分析.结果表明:提出的电动汽车主动安全避撞控制方法可满足车辆安全避撞需求,控制方法合理有效.

2021-06-24 22:03:20 1.58MB Matlab 电动汽车 避撞控制 最优控制

个人信息

热门下载

最新下载

其他资源