olga手册
2021-03-25 09:07:42 7.66MB 强化学习
1
顶管穿越施工技术
2021-03-25 09:07:40 222KB 强化学习
1
【兰德公司报告】通过机器学习获得空中优势—人工智能辅助任务规划的初步探索 Air Dominance Through Machine Learning:A Preliminary Exploration of Artificial Intelligence–Assisted Mission Planning
2021-03-24 22:03:57 13.67MB 人工智能 智能规划 深度强化学习
1
该文档是导师给我安排的强化学习相关算法的学习任务,要求做出一份报告交给导师。适合对强化学习有兴趣的初学者。
2021-03-24 15:10:38 792KB 强化学习
1
np问题 背包问题、协同滤波
2021-03-23 17:04:48 2.04MB 强化学习
1
模仿 在python / Tensorflow中实现选定的逆向强化学习(IRL)算法。 python demo.py 实现的算法 线性逆强化学习(Ng&Russell 2000) 最大熵逆强化学习(Ziebart et al。2008) 最大熵深度逆强化学习(Wulfmeier et al。2015) 已实施MDP和求解器 网格世界2D 网格世界1D 价值迭代 依存关系 python 2.7 cvxopt Tensorflow 0.12.1 matplotlib 线性逆向强化学习 根据Ng和Russell 2000的论文:算法,算法1 $ python linear_irl_
1
Bandit Algorithm
2021-03-23 13:02:16 4.73MB BanditAlgorithm 强化学习
1
10中文实验手册.pdf
2021-03-22 09:08:39 5.48MB 强化学习
1
LunarLanderAgent 张量流的LunarLander强化学习 我在启动Box2d安装时遇到了困难,我尝试使用pip install Box2d而不是pip install gym[all]并成功了。 确保环境正常运行: 虚拟代码: import numpy as np import matplotlib.pyplot as plt import tensorflow as tf import gym env = gym.make('LunarLander-v2') obs = env.reset() for i in range(1000): obs, reward, done, info = env.step(env.action_space.sample()) env.render() if done: break env.clos
2021-03-21 17:08:38 5.21MB Python
1