基于值函数和策略梯度的深度强化学习综述
2022-05-04 14:06:44 1.65MB 源码软件
Q-learning是一种无模型强化学习算法。Q-learning的目标是学习一个策略,,包括前馈、反向传播、梯度下降等。 基于深度强化学习Qlearning的智能小车避障训练和测试,带操作界面,matlab2021a测试运行。运行时,注意matlab操作界面左侧的路径窗口,必须是该文件夹,以供matlab调用各个子函数。
针对服务功能链映射对网络时延和部署失败率的影响,提出了一种基于深度强化学习的服务功能链映射算法DQN-SFC。首先构建了一个多层次NFV管理编排架构,以满足算法对资源感知和设备配置的需求;然后基于马尔可夫决策过程建模,对SFC映射问题进行形式化描述;最后构建了一个深度强化学习网络,将网络平均时延和部署失败产生的运维开销作为奖惩反馈,经过训练后可根据网络状态决定虚拟网络功能的部署位置。通过仿真实验,对该算法的正确性和性能优势进行了验证。实验表明:与传统算法相比,该算法能有效降低网络平均时延和部署失败率,同时算法运行时间具有一定优势。
1
基于深度强化学习的小球弹射控制系统仿真对比DDPG和TD3,matlab2021a仿真测试。
2022-05-02 14:10:22 2.03MB 源码软件 深度强化学习DDPG和TD3
基于多智能体的深度强化学习RL的优化OBSS干扰的matlab仿真,matlab2021a测试,深度强化学习训练过程仿真较长。
基于Qlearning深度强化学习的最小化OBSS干扰的matlab仿真_优化过程为20round,matlab2021a测试。
深度强化学习的对抗攻防算法研究
2022-04-27 17:04:06 989KB 毕业
基于深度强化学习Qlearning的机器人行走控制,matlab2021a测试,给定一个地图,然后对比Qlearning控制下的行走和随机行走的效果对比
2022-04-26 10:05:55 6KB 文档资料 Qlearning
一种基于深度强化学习的SDN 路由算法
2022-04-26 09:07:11 750KB 算法
MIT最新深度学习课程关于《深度强化学习课程》,附Slides。
2022-04-25 20:07:39 3.43MB 深度学习 文档资料 人工智能 数据分析