针对部分可观测马氏决策过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策 略可能发生振荡的现象, 研究了一种基于记忆的强化学习算法——CPnSarsa (K) 学习算法来解决该问题. 它通过重新 定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最 优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.
1
针对小波阈值降噪中硬阈值函数和软阈值函数的不足,结合现有文献提出一种新的阈值函数。新阈值函数克服了传统阈值函数的缺点,保证了阈值函数的连续性,同时可以通过改变参数灵活地调节函数。在新阈值函数的基础上结合改进的阈值确定方法,提出一种新的降噪算法。通过MATLAB仿真,对几种小波降噪算法进行了试验分析,利用信噪比和均方根误差两个指标进行评价。结果表明,相比于传统的降噪算法,新降噪算法取得了更好的降噪效果。
2021-06-25 11:05:57 156KB 小波降噪
1
为提高电动汽车的安全性,详细分析了电动汽车纵向控制过程,构建了车辆安全距离模型,结合实际避撞需求设计了纵向控制器,并利用Matlab软件对设计的电动汽车主动安全避撞控制方法进行仿真分析.结果表明:提出的电动汽车主动安全避撞控制方法可满足车辆安全避撞需求,控制方法合理有效.
2021-06-24 22:03:20 1.58MB Matlab 电动汽车 避撞控制 最优控制
小车上山实验是强化学习经典案例,与网上大多数资源不同,该资源提供小车上山完整python代码,并以图形化的形式实现强化学习功能,值得一学。
2021-06-24 21:12:16 3KB 强化学习 小车上山 python
1
近年来,人工智能技术已被应用于无线通信领域,以解决传统无线通信技术面对信息爆炸和万物互联等新发展趋势所遇到的瓶颈问题。首先介绍深度学习、深度强化学习和联邦学习三类具有代表性的人工智能技术;然后通过对这三类技术在无线通信中的无线传输、频谱管理、资源配置、网络接入、网络及系统优化5个方面的应用进行综述,分析和总结它们在解决无线通信问题时的原理、适用性、设计方法和优缺点;最后围绕存在的局限性指出智能无线通信技术的未来发展趋势和研究方向,期望为无线通信领域的后续研究提供帮助和参考。
1
python实现强化学习Q-learning走迷宫例子,包含3个文件.详细描述可见:https://blog.csdn.net/Eric_Fisher/article/details/90664819
2021-06-21 20:58:59 3KB 强化学习 Q-learning 走迷宫例子
1
这是 bang-bang 控制器的一个例子。 问题陈述取自 Optimal Control Systems by DS Naidu,第 1 页。 306,这是关于质量为“m”的块在无摩擦环境中受到外力 f(t) 时的简单运动。 运动描述如下: m * y''(t)= f(t) 其中,y(t) 是时间 t 时块的位置,因此,y'(t) 和 y"(t) 分别表示块的速度和加速度。 在 Simulink 模型中,x_1 是模块位置 (y) 的状态变量,x_2 是模块速度 (y') 的状态变量。 初始条件可以在它们各自的块中改变。 控制输入​​可以从标记为“控制输入”的范围内可视化。
2021-06-21 15:21:49 22KB matlab
1
ddpg DDPG(深度确定性策略梯度)在Gym-torcs上的实现。 与张量流。 ddpg论文: ://arxiv.org/pdf/1509.02971v2.pdf 作者:肯尼斯·于 安装依赖项: 张量流r1.4 gym_torcs: : 如何运行: 训练方式: python3 gym_torcs_train_low_dim.py 评估模式: python3 gym_torcs_eval_low_dim.py
2021-06-21 11:48:03 30KB 附件源码 文章源码
1
线性二次型系统,采用最优控制器,同时应用MATLAB编程来实现
2021-06-21 11:21:21 204KB 线性二次型 最优控制器 MATLAB
1
本文介绍了线性二次型最优控制的基本原理,并给定了一个具体的控制系统,利用MATLAB软件对其最优控制矩阵进行了求解,最后用SIMULINK对所给定的系统进行了仿真,通过仿真实验,设计所得到的线性二次型最优控制效果比较好,达到了设计的目的。
2021-06-21 11:19:14 63KB MATLAB 线型二次型 最优控制 SIMULINK
1