软件定义网络中的DDoS仿真 该项目旨在为使用深度强化学习的DDoS缓解提供基本框架。 该网络使用Mininet(基于软件定义网络)实现。 入门 克隆存储库 git clone https://github.com/santhisenan/SDN_DDoS_Simulation.git 先决条件 安装依赖项 安装Mininet 安装OpenVSwitch 安装Ryu 安装Tensorflow 安装Keras 克隆ryu存储库并将ryu / ryu文件夹复制到SDN_DDoS_Simulation根目录 测验 根据测试目的修改simple_tree_top.py cd SDN_DDo
2021-06-28 08:24:20 878KB reinforcement-learning tensorflow sdn ryu
1
MATLAB强化学习代码包,用于解决多步决策模型(网格迷宫问题)的Sarsa算法。 编程与算法的详细说明可参看我的专栏:https://blog.csdn.net/weixin_43723517/category_9676083.html "I thought what I'd do was I'd pretend I was one of those deaf-mutes, or should I?"
2021-06-27 23:20:29 2KB matlab 强化学习 机器学习 Sarsa算法
1
MATLAB强化学习代码包,用于解决多步决策模型(网格迷宫问题)的Q-Learning算法。 编程与算法的详细说明可参看我的专栏:https://blog.csdn.net/weixin_43723517/category_9676083.html "I thought what I'd do was I'd pretend I was one of those deaf-mutes, or should I?"
2021-06-27 23:03:51 2KB matlab 强化学习 机器学习 Q-Learning
1
莫烦编程QL一维寻宝程序(Python改MATLAB实现)
2021-06-27 19:04:10 6KB 强化学习 matlab
1
参考 6.4 (Sarsa: On-Policy TD Control), Reinforcement learning: An Introduction, RS Sutton, AG Barto, MIT press 在这个演示中,强化学习技术 SARSA 解决了两个不同的迷宫。 State-Action-Reward-State-Action (SARSA) 是一种用于学习马尔可夫决策过程策略的算法,用于强化学习。 SARSA,动作价值函数的更新: Q(S{t}, A{t}) := Q(S{t}, A{t}) + α*[ R{t+1} + γ ∗ Q(S{t+1}, A{ t+1}) − Q(S{t}, A{t}) ] 学习率 (α) 学习率决定了新获取的信息在多大程度上覆盖旧信息。 因子为 0 将使代理不学习任何东西,而因子为 1 将使代理仅考虑最近的信息。 折扣系数 (γ)
2021-06-27 13:54:05 118KB matlab
1
强化学习导论》摘录之强化学习与有监督学习、监督学习的区别; Reinforcement Learning: An Introduction; The differences between reinforcement learning and supervised learning, unsupervised learning.
1
基于模型的强化学习(MBRL)最近获得了极大的兴趣,因为它具有潜在的样本效率和合并非策略数据的能力。然而,使用富函数逼近器设计稳定、高效的MBRL算法仍然具有挑战性。
2021-06-26 11:02:26 3.96MB RL
1
针对部分可观测马氏决策过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策 略可能发生振荡的现象, 研究了一种基于记忆的强化学习算法——CPnSarsa (K) 学习算法来解决该问题. 它通过重新 定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最 优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.
1
针对小波阈值降噪中硬阈值函数和软阈值函数的不足,结合现有文献提出一种新的阈值函数。新阈值函数克服了传统阈值函数的缺点,保证了阈值函数的连续性,同时可以通过改变参数灵活地调节函数。在新阈值函数的基础上结合改进的阈值确定方法,提出一种新的降噪算法。通过MATLAB仿真,对几种小波降噪算法进行了试验分析,利用信噪比和均方根误差两个指标进行评价。结果表明,相比于传统的降噪算法,新降噪算法取得了更好的降噪效果。
2021-06-25 11:05:57 156KB 小波降噪
1
为提高电动汽车的安全性,详细分析了电动汽车纵向控制过程,构建了车辆安全距离模型,结合实际避撞需求设计了纵向控制器,并利用Matlab软件对设计的电动汽车主动安全避撞控制方法进行仿真分析.结果表明:提出的电动汽车主动安全避撞控制方法可满足车辆安全避撞需求,控制方法合理有效.
2021-06-24 22:03:20 1.58MB Matlab 电动汽车 避撞控制 最优控制