搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

强化学习基础算法介绍+Pytorch代码（相信我，绝对是你想要的）

2022-09-08 12:14:13 15.6MB 强化学习 pytorch

1

Optimization-Based Control

加州大学Richard M. Murray教授等人由课程讲义编写的书稿，介绍了最优控制、滚动时域、随机系统、Kalman滤波等。

2022-09-07 16:51:09 1.1MB 最优控制 优化

1

Auto RL（强化学习）；答辩总结

Auto RL调研结果；答辩总结

2022-09-07 12:05:15 15.56MB AutoRL

1

Android学习我感觉挺不错的哈哈

2022-09-05 14:06:15 6.59MB 强化学习

1

（外 Q1 2021）基于多尺度特征融合的深度监督卷积神经网络路面裂缝检测

在这项工作中，提出了一种用于裂纹检测的深度监督网络。在该网络中，DeepLab被用作密集特征提取器，以获得多尺度卷积特征。采用了一种新的多尺度特征融合模块。该模块背后的主要动机是解决U形结构中具有语义信息的深层特征在逐层融合过程中被稀释的问题。深度监督学习用于多尺度特征的集成直接监督。此外，采用加权交叉熵损失函数来解决路面裂缝数据的样本不平衡问题。为了进行性能评估，我们分别在三个公共裂缝数据集上进行了实验。实验结果表明，我们的方法优于最先进的裂纹检测方法。

2022-09-04 20:05:31 15.32MB 强化学习

1

边做边学深度强化学习：PyTorch程序设计实践迷宫 Q-Learning

2022-09-02 22:05:30 1.87MB 边学边做深度强化学习

1

边做边学深度强化学习：PyTorch程序设计实践倒立摆 DQN 实现

2022-09-02 22:05:29 440KB 边做边学深度强化学习

1

边做边学深度强化学习：PyTorch程序设计实践倒立摆 Q-Learning

2022-09-02 22:05:28 244KB 边做边学深度强化学习

1

大规模车辆路径问题的深度强化学习算法研究 mind map

本文以深度强化学习为基础，设计出一种适用于求解大规模车辆路径问题的模型架构。采用了预训练模型+基于相对位置的 Transformer网络+A2C强化学习训练框架，为后续研究大规模车辆路径问题的扩展问题和大规模组合优化问题提供了新的深度强化学习算法框架。本文中的深度强化学习算法解决了以下问题：（1）不同规模算例可以共享并继承其他规模训练完的模型，在这种共享模型的机制下，避免了算例规模相近的模型的重复训练。（2）预训练模型能够继承其他规模训练出的模型经验，相对位置节点提高了在大规模车辆路径问题中特征抓取的精确性，A2C强化学习训练框架环节采用无监督学习，在无标签训练集中训练中规避经验回溯问题，这三方面针对大规模车辆路径问题做出的调整，提高了训练效率和收敛效果。（3）通过预训练机制解决了大规模车辆路径问题内存溢出的情况，解决了目前已有算法在大规模算例训练时，内存溢出训练中断等问题。（4）与经典的启发式算法和元启发式算法进行比较，在同等求解速度的算法中，本文算法的求解质量方面全面超越这些算法。并且在当前已有的深度强化学习解决方案中，本文设计的算法和效

2022-09-02 19:07:15 4.58MB 深度强化学习 VRP

1

边做边学深度强化学习：PyTorch程序设计实践迷宫随机实验

边做边学深度强化学习：PyTorch程序设计实践迷宫随机实验代码

2022-09-02 18:05:39 1.74MB 边做边学深度强化学习

1

个人信息

热门下载

最新下载

其他资源