大数据-算法-非线性分段光滑动力系统的最优控制及稳定性.pdf
2022-05-03 19:09:05 4.72MB big data 算法 文档资料
针对服务功能链映射对网络时延和部署失败率的影响,提出了一种基于深度强化学习的服务功能链映射算法DQN-SFC。首先构建了一个多层次NFV管理编排架构,以满足算法对资源感知和设备配置的需求;然后基于马尔可夫决策过程建模,对SFC映射问题进行形式化描述;最后构建了一个深度强化学习网络,将网络平均时延和部署失败产生的运维开销作为奖惩反馈,经过训练后可根据网络状态决定虚拟网络功能的部署位置。通过仿真实验,对该算法的正确性和性能优势进行了验证。实验表明:与传统算法相比,该算法能有效降低网络平均时延和部署失败率,同时算法运行时间具有一定优势。
1
基于持续期模型的网络银行利率风险最优控制,石晓峰,,本文首先从宏观和微观两个角度分析了网络银行利率风险的特性,指出网络银行面临的利率风险在深度、广度、信用卡业务、国外储蓄业
2022-05-02 15:50:48 470KB 首发论文
1
基于深度强化学习的小球弹射控制系统仿真对比DDPG和TD3,matlab2021a仿真测试。
2022-05-02 14:10:22 2.03MB 源码软件 深度强化学习DDPG和TD3
基于多智能体的深度强化学习RL的优化OBSS干扰的matlab仿真,matlab2021a测试,深度强化学习训练过程仿真较长。
基于Qlearning深度强化学习的最小化OBSS干扰的matlab仿真_优化过程为20round,matlab2021a测试。
所有代码都是用Python 3编写的,并使用OpenAI Gym的RL环境。高级技术使用Tensorflow实现神经网络。 This repository provides code, exercises and solutions for popular Reinforcement Learning algorithms. These are meant to serve as a learning tool to complement the theoretical materials from Reinforcement Learning: An Introduction (2nd Edition) David Silver's Reinforcement Learning Course Each folder in corresponds to one or more chapters of the above textbook and/or course. In addition to exercises and solution, each folder als
2022-04-30 22:06:43 1.49MB python 算法 源码软件 开发语言
RLBook资料集锦。 强化学习入门资料Algorithms for Reinforcement Learning。 强化学习导论和代码实例。 中文英文都有。
2022-04-29 18:10:13 59.64MB 强化学习 论文 RL 机器学习
1
最优控制这门选修课的习题答案,题目来源于刘豹的《现代控制理论》第六章的课后题
2022-04-29 18:04:18 106.09MB 文档资料 最优控制 USTC
1

伪谱法通过全局插值多项式参数化状态和控制变量, 将最优控制问题(OCP) 转化为非线性规划问题(NLP) 进行求解, 是一类具有更高求解效率的直接法. 总结Legendre 伪谱法转化Bolza 型最优控制问题的基本框架, 推导OCP 伴随变量与NLP 问题KKT乘子的映射关系, 建立基于拟牛顿法的LGL 配点数值计算方法, 并针对非光滑系统, 进一步研究分段伪谱逼近策略. 基于上述理论开发通用OCP 求解器, 并对3 个典型最优控制问题进行求解, 结果表明了所提出方法和求解器的有效性.

1