DRL从游戏到自动驾驶 驾驶策略智能化建模 面向无人车运营的持续改进 系统框架 模型和预监督 主算法效果优化 探索策略演进 探索策略优化 案例演示 大集合效果
2022-05-23 11:20:53 7.08MB 自动驾驶 游戏 人工智能 机器学习
1
:提出一种基于深度强化学习的电网切机控制策略,所 提控制策略依据电网运行环境信息,通过数据分析得到切机 控制策略。首先介绍强化学习框架,阐述学习算法原理,并 详细介绍Q-Learning 方法。然后介绍深度学习基本概念和 深度卷积网络原理,提出利用深度卷积网络提取电网运行特 征,构建切机策略的思路。再结合深度学习和强化学习,构 建深度强化学习框架,其中深度学习采用深度卷积神经网络 模型用于提取特征,强化学习采用双重Q-Learning 和竞争 Q-Learning 模型计算Q 值,通过比较Q 值大小得到切机控 制策略。最后,利用IEEE 39 节点系统验证了方法的正确性。
1
PyTorch度量学习文档请在此处查看文档Google Colab示例请参阅示例文档文件夹,以显示带有loggin的整个培训/测试工作流程。PyTorch Metric学习文档请在此处查看文档,其中Google Colab示例请参阅示例文件夹,以显示完整的培训/测试工作流程与日志记录和模型保存。 该库的优点易于使用在培训循环中只需两行代码即可向您的应用程序添加度量学习。 通过一个功能调用即可实现矿井对和三井架。 灵活性以其他图书馆的方式混合和匹配损失,矿工和培训师
2022-05-21 22:59:01 12.91MB Python Deep Learning
1
深度学习品质刻画:评测工具的开发与应用——基于四城市小学生数学学习的实证研究
2022-05-19 22:06:43 4.74MB 深度学习 学习 源码软件 人工智能
深度强化学习Q-Learning在协作认知无线电网络中的应用+含代码操作演示视频 运行注意事项:使用matlab2021a或者更高版本测试,运行里面的Runme.m文件,不要直接运行子函数文件。运行时注意matlab左侧的当前文件夹窗口必须是当前工程所在路径。具体可观看提供的操作录像视频跟着操作。
深度强化学习对比,对比了DDPG,PG以及TD3三种方法+含代码操作演示视频 运行注意事项:使用matlab2021a或者更高版本测试,运行里面的Runme.m文件,不要直接运行子函数文件。运行时注意matlab左侧的当前文件夹窗口必须是当前工程所在路径。具体可观看提供的操作录像视频跟着操作。
2022-05-18 12:06:12 822KB 源码软件 深度强化学习 DDPG PG
基于深度强化学习的差分驱动移动机器人行驶控制matlab仿真+含代码操作演示视频 运行注意事项:使用matlab2021a或者更高版本测试,运行里面的Runme.m文件,不要直接运行子函数文件。运行时注意matlab左侧的当前文件夹窗口必须是当前工程所在路径。具体可观看提供的操作录像视频跟着操作。
2022-05-17 12:06:11 100.34MB 深度强化学习 行驶控制
思维导图根据王树森老师课件整理。 主要包括: 强化学习基本概念 基本方法(Value-Based、Policy-Based、Actor-Critic) 策略学习(Reinforce with baseline、A2C) 价值学习(Sarsa、Q-Learning(DQN)) 连续动作控制(DPG、DDPG) 包含上述各种基本算法的原理及公式推导
2022-05-16 11:05:40 24MB 机器学习 深度学习 强化学习
1
这是几篇最新中文深度强化学习综述。综述了深度强化学习的发展历程, 兼论计算机围棋的历史, 阐述了3类主要的深度强化学习方法,包括基于值函数的深度强化学习、基于策略梯度的深度强化学习和基于搜索与监督的深度强化学习;其次对深度强化学习领域的一些前沿研究方向进行了综述,包括分层深度强化学习、多任务迁移深度强化学习、多智能体深度强化学习、基于记忆与推理的深度强化学习等.最后总结了深度强化学习在若干领域的成功应用和未来发展趋势。本文是中文深度强化学习综述,更利于入门学习者理解。
2022-05-15 18:59:29 3.77MB 深度强化学习
1