深度强化学习和贪婪搜寻算法的训练对比仿真
2022-05-07 09:11:20 12KB 算法 源码软件 深度强化学习
基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python)
2022-05-07 09:03:57 113KB python 源码软件 开发语言
一个比较简单的深度强化学习训练过程仿真,输出奖励值
2022-05-05 21:05:32 946B 文档资料 深度强化学习
基于值函数和策略梯度的深度强化学习综述
2022-05-04 14:06:44 1.65MB 源码软件
Q-learning是一种无模型强化学习算法。Q-learning的目标是学习一个策略,,包括前馈、反向传播、梯度下降等。 基于深度强化学习Qlearning的智能小车避障训练和测试,带操作界面,matlab2021a测试运行。运行时,注意matlab操作界面左侧的路径窗口,必须是该文件夹,以供matlab调用各个子函数。
针对服务功能链映射对网络时延和部署失败率的影响,提出了一种基于深度强化学习的服务功能链映射算法DQN-SFC。首先构建了一个多层次NFV管理编排架构,以满足算法对资源感知和设备配置的需求;然后基于马尔可夫决策过程建模,对SFC映射问题进行形式化描述;最后构建了一个深度强化学习网络,将网络平均时延和部署失败产生的运维开销作为奖惩反馈,经过训练后可根据网络状态决定虚拟网络功能的部署位置。通过仿真实验,对该算法的正确性和性能优势进行了验证。实验表明:与传统算法相比,该算法能有效降低网络平均时延和部署失败率,同时算法运行时间具有一定优势。
1
基于深度强化学习的小球弹射控制系统仿真对比DDPG和TD3,matlab2021a仿真测试。
2022-05-02 14:10:22 2.03MB 源码软件 深度强化学习DDPG和TD3
基于多智能体的深度强化学习RL的优化OBSS干扰的matlab仿真,matlab2021a测试,深度强化学习训练过程仿真较长。
基于Qlearning深度强化学习的最小化OBSS干扰的matlab仿真_优化过程为20round,matlab2021a测试。
深度强化学习的对抗攻防算法研究
2022-04-27 17:04:06 989KB 毕业