强化学习基础算法介绍+Pytorch代码(相信我,绝对是你想要的)
2022-09-08 12:14:13 15.6MB 强化学习 pytorch
1
Auto RL调研结果;答辩总结
2022-09-07 12:05:15 15.56MB AutoRL
1
Android学习 我感觉挺不错的 哈哈
2022-09-05 14:06:15 6.59MB 强化学习
1
在这项工作中,提出了一种用于裂纹检测的深度监督网络。在该网络中,DeepLab被用作密集特征提取器,以获得多尺度卷积特征。采用了一种新的多尺度特征融合模块。 该模块背后的主要动机是解决U形结构中具有语义信息的深层特征在逐层融合过程中被稀释的问题。深度监督学习用于多尺度特征的集成直接监督。此外,采用加权交叉熵损失函数来解决路面裂缝数据的样本不平衡问题。为了进行性能评估,我们分别在三个公共裂缝数据集上进行了实验。实验结果表明,我们的方法优于最先进的裂纹检测方法。
2022-09-04 20:05:31 15.32MB 强化学习
1
边做边学深度强化学习:PyTorch程序设计实践 迷宫 Q-Learning
2022-09-02 22:05:30 1.87MB 边学边做深度强化学习
1
边做边学深度强化学习:PyTorch程序设计实践 倒立摆 DQN 实现
2022-09-02 22:05:29 440KB 边做边学深度强化学习
1
边做边学深度强化学习:PyTorch程序设计实践 倒立摆 Q-Learning
2022-09-02 22:05:28 244KB 边做边学深度强化学习
1
本文以深度强化学习为基础,设计出一种适用于求解大规模车辆路径问题的模型架 构。采用了预训练模型+基于相对位置的 Transformer网络+A2C强化学习训练框架,为 后续研究大规模车辆路径问题的扩展问题和大规模组合优化问题提供了新的深度强化 学习算法框架。本文中的深度强化学习算法解决了以下问题: (1) 不同规模算例可以共享并继承其他规模训练完的模型,在这种共享模型的机制下, 避免了算例规模相近的模型的重复训练。 (2) 预训练模型能够继承其他规模训练出的模型经验,相对位置节点提高了在大规模 车辆路径问题中特征抓取的精确性,A2C强化学习训练框架环节采用无监督学习, 在无标签训练集中训练中规避经验回溯问题,这三方面针对大规模车辆路径问题 做出的调整,提高了训练效率和收敛效果。 (3) 通过预训练机制解决了大规模车辆路径问题内存溢出的情况,解决了目前已有算 法在大规模算例训练时,内存溢出训练中断等问题。 (4) 与经典的启发式算法和元启发式算法进行比较,在同等求解速度的算法中,本文 算法的求解质量方面全面超越这些算法。并且在当前已有的深度强化学习解决方 案中,本文设计的算法和效
2022-09-02 19:07:15 4.58MB 深度强化学习 VRP
1
边做边学深度强化学习:PyTorch程序设计实践 迷宫 随机实验代码
2022-09-02 18:05:39 1.74MB 边做边学深度强化学习
1
边做边学深度强化学习:PyTorch程序设计实践 迷宫 Sarsa
2022-09-02 18:05:38 189KB 边学边做深度强化学习 Sarsa
1