搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

大数据-算法-非线性分段光滑动力系统的最优控制及稳定性.pdf

2022-05-03 19:09:05 4.72MB big data 算法 文档资料

针对服务功能链映射对网络时延和部署失败率的影响，提出了一种基于深度强化学习的服务功能链映射算法DQN-SFC。首先构建了一个多层次NFV管理编排架构，以满足算法对资源感知和设备配置的需求；然后基于马尔可夫决策过程建模，对SFC映射问题进行形式化描述；最后构建了一个深度强化学习网络，将网络平均时延和部署失败产生的运维开销作为奖惩反馈，经过训练后可根据网络状态决定虚拟网络功能的部署位置。通过仿真实验，对该算法的正确性和性能优势进行了验证。实验表明：与传统算法相比，该算法能有效降低网络平均时延和部署失败率，同时算法运行时间具有一定优势。

2022-05-02 20:39:59 1.54MB 网络功能虚拟化 服务功能链 深度强化学习

1

基于持续期模型的网络银行利率风险最优控制

基于持续期模型的网络银行利率风险最优控制，石晓峰，，本文首先从宏观和微观两个角度分析了网络银行利率风险的特性，指出网络银行面临的利率风险在深度、广度、信用卡业务、国外储蓄业

2022-05-02 15:50:48 470KB 首发论文

1

基于深度强化学习的小球弹射控制系统仿真对比DDPG和TD3，matlab2021a仿真测试。

2022-05-02 14:10:22 2.03MB 源码软件 深度强化学习DDPG和TD3

基于多智能体的深度强化学习RL的优化OBSS干扰的matlab仿真，matlab2021a测试，深度强化学习训练过程仿真较长。

2022-05-01 12:06:07 6KB matlab 文档资料 开发语言 深度强化学习RL

基于Qlearning深度强化学习的最小化OBSS干扰的matlab仿真_优化过程为20round，matlab2021a测试。

2022-05-01 12:06:06 96KB matlab 文档资料 开发语言 Qlearning深度强化学习

基于python的强化学习算法

所有代码都是用Python 3编写的，并使用OpenAI Gym的RL环境。高级技术使用Tensorflow实现神经网络。 This repository provides code, exercises and solutions for popular Reinforcement Learning algorithms. These are meant to serve as a learning tool to complement the theoretical materials from Reinforcement Learning: An Introduction (2nd Edition) David Silver's Reinforcement Learning Course Each folder in corresponds to one or more chapters of the above textbook and/or course. In addition to exercises and solution, each folder als

2022-04-30 22:06:43 1.49MB python 算法 源码软件 开发语言

强化学习入门资料Algorithms for Reinforcement Learning

RLBook资料集锦。强化学习入门资料Algorithms for Reinforcement Learning。强化学习导论和代码实例。中文英文都有。

2022-04-29 18:10:13 59.64MB 强化学习 论文 RL 机器学习

1

USTC李俊老师最优控制作业答案（刘豹的《现代控制理论》第六章的课后题答案）

最优控制这门选修课的习题答案，题目来源于刘豹的《现代控制理论》第六章的课后题

2022-04-29 18:04:18 106.09MB 文档资料 最优控制 USTC

1

最优控制问题的Legendre 伪谱法求解及其应用

伪谱法通过全局插值多项式参数化状态和控制变量, 将最优控制问题(OCP) 转化为非线性规划问题(NLP) 进行求解, 是一类具有更高求解效率的直接法. 总结Legendre 伪谱法转化Bolza 型最优控制问题的基本框架, 推导OCP 伴随变量与NLP 问题KKT乘子的映射关系, 建立基于拟牛顿法的LGL 配点数值计算方法, 并针对非光滑系统, 进一步研究分段伪谱逼近策略. 基于上述理论开发通用OCP 求解器, 并对3 个典型最优控制问题进行求解, 结果表明了所提出方法和求解器的有效性.

2022-04-28 12:03:59 278KB 最优控制|伪谱法|非线性规划|数值求解

1

个人信息

热门下载

最新下载

其他资源