详细研究了深度Q-学习算法,它形成了深度Q网络(DQN)的基础这可能是当今强化学习中最具创新性的领域。这里将逐步介绍DQN,包括一些改变游戏规则的创新,如体验回放,以准确了解它们是如何帮助dqn在首次引入时实现世界一流的结果的。
2022-10-31 09:08:47 1.29MB 强化学习 机器学习 DQN
1
一个最优控制的matlab软件包,里面包含了各种最优控制算法的实现,详见文件内m文件
1
附有论文,交通信号灯识别源程序。采DDPG深度强化学习方法。给出了LOSS损失函数图像
1
PyTorch中的RAHGCN 1.概述 该存储库是PyTorch中通过强化学习(RAHGCN)实现的自适应双曲图卷积神经网络。 下游任务包括: 链接预测( lp ) 节点分类( nc ) 2.设定 2.1下载代码 首先从Github下载源代码。 git clone git@github.com:fuxingcheng/RHGNN.git" cd rahgcn 2.2启动虚拟环境 我们建议在虚拟环境中设置我们的项目。 您可以选择conda或virtualenv来创建和管理虚拟环境。 如果您尚未安装conda,请按照的说明进行安装。 如果尚未安装virtualenv,则只需运行pip3 install virtualenv 。 对于conda : conda env create -f environment.yml python=3.6 source activate ra
2022-10-26 21:08:44 6.5MB Python
1
机器学习课程笔记(第一章的第一节和第二节)机器学习的概念和分类
2022-10-25 12:05:11 2.22MB 机器学习 监督学习 强化学习
1
描述离散系统最优控制,包含泛函数,离散LQR问题等内容
2022-10-25 09:33:13 343KB 离散系统
1
本论文工作研究了深度学习,强化学习,深度强化学习,计算机围棋四者之间的关系,从而设计出一套成熟的计算机深度强化学习系统
2022-10-24 13:10:01 3.96MB
1
python编写,即跑即用,no bugs,有训练好的model。 使用蒙特卡洛树搜索与深度神经网络来设计一种基于强化学习的AI五子棋算法,实现了从零开始学习五子棋博弈的人工智能算法。
车辆系统动力学主动悬架线性最优控制(LQG)程序,在simulink环境下仿真计算出路面输入下的最优主动悬架性能,并于传动被动悬架作出对比
1
使用MATLAB/simulink创建悬架模型,设计LQG最优控制器,进行汽车主动悬架最优控制
1