搜索【reinforcement-learning】的结果

Reinforcement-Learning:Matlab 项目

强化学习您可以在此处找到强化学习 Matlab 中的项目。 TP1：策略评估、策略迭代、价值迭代、Q-learning TP2：多臂强盗，汤普森采样

2022-05-19 14:50:39 1.12MB TeX

1

never-give-up:永不放弃的PyTorch实现

永不放弃永不放弃的PyTorch实施：学习定向探索策略[] 仅实施了具有嵌入网络的偶然性好奇心。安装使用Python 3.7.9测试 pip install -r requirements.txt 火车 python train.py 结果 5x5结果学分 R2D2基地是从通过

2022-05-17 22:31:41 48KB reinforcement-learning pytorch r2d2 exploration-strategy

1

AIGames：使用AI玩一些游戏

AI游戏 use AI to play some games. You can star this repository to keep track of the project if it's helpful for you, thank you for your support. 内容名称实施算法的数量码用中文（表达 AISnake 2 AI贪吃蛇车手 1个 AI俄罗斯方块五子棋 1个 AI五子棋 AITRexRush 3 AIChrome浏览器小恐龙游戏爱庞 1个 AI乒乓球 AIPianoTiles 1个 AI别再踩白块了艾帕克曼 1个 AI吃豆人 AIFlappyBird 2 AI飞扬的小鸟更多微信公众号查尔斯·皮卡丘

2022-05-12 14:55:24 527.53MB game algorithm reinforcement-learning ai

1

Applications of Deep Reinforcement Learning in Communications and Networking.pdf

IEEE COMMUNICATIONS SURVEYS & TUTORIALS, VOL. 21, NO. 4, FOURTH QUARTER 2019 Nguyen Cong Luong , Dinh Thai Hoang , Member, IEEE, Shimin Gong , Member, IEEE, Dusit Niyato , Fellow, IEEE,PingWang , Senior Member, IEEE, Ying-Chang Liang , Fellow, IEEE, and Dong In Kim , Fellow, IEEE

2022-05-09 17:14:09 5.17MB 强化学习 综述 通信和网络

1

awesome-monte-carlo-tree-search-papers:带有实现的蒙特卡罗树搜索论文的精选列表

很棒的蒙特卡洛树搜索论文。 ⠀ ⠀⠀ 蒙特卡罗树搜索论文的精选列表，其中包含来自以下会议/期刊的实现：机器学习计算机视觉自然语言处理数据人工智能 UAI 机器人RAS 游戏CIG 关于图分类、梯度提升、分类/回归树、欺诈检测和社区检测论文的类似集合以及实现。 2021年学习停止：动态模拟蒙特卡罗树搜索（AAAI 2021） Li-Cheng Lan, Ti-Rong Wu, I-Chen Wu, Cho-Jui Hsieh [纸] Dec-SGTS：多代理协调的分散子目标树搜索（AAAI 2021）李明龙、蔡忠轩、杨文静、吴丽霞、徐颖慧、王季 [纸] 改进的 POMDP 树搜索规划与优先行动分支 (AAAI 2021) 约翰·默恩、阿尼尔·耶尔迪兹、劳伦斯·布什、Tapan Mukerji、Mykel J. Kochenderfer [纸]

2022-05-09 13:54:25 39KB learning machine-learning reinforcement-learning deep-learning

1

Reinforcement Learning for Financial Trading：关于如何使用强化学习开发金融交易模型的 MATLAB 示例-matlab开发

金融交易的强化学习？如何使用 MATLAB 使用模拟股票数据将强化学习用于金融交易。设置跑步：打开 RL_trading_demo.prj 打开工作流.mlx 运行工作流.mlx 环境和奖励可以在：myStepFunction.m 中找到概述：强化学习代理的目标很简单。了解如何在不损失资金的情况下进行金融市场交易。请注意，这与学习如何交易市场并尽可能多地赚钱不同。这个例子的目的是展示： 1.什么是强化学习2. 如何将其应用于金融市场交易3. 为金融专业人士留下一个起点，让他们利用自己的领域专业知识来使用和增强。该示例使用的环境由 3 只股票、20000 美元现金和 15 年的历史数据组成。股票是：通过几何布朗运动或历史市场数据（来源：AlphaVantage： www.alphavantage.co ）版权所有2020 The MathWorks，

2022-05-06 05:23:29 3.97MB matlab

1

cadrl_ros：ROS软件包，用于经过深度RL训练的地面机器人动态避障

cadrl_ros（使用Deep RL避免冲突）用Deep RL训练的动态避障算法的ROS实现纸： M.Everett，Y.Chen和JP How，《具有深度强化学习的动态决策代理之间的运动计划》，IEEE / RSJ国际智能机器人和系统会议（IROS），2018年论文： : 视频： : Bibtex： @inproceedings{Everett18_IROS, address = {Madrid, Spain}, author = {Everett, Michael and Chen, Yu Fan and How, Jonathan P.}, bookti

2022-05-05 21:18:49 6.26MB tensorflow deep-reinforcement-learning ros collision-avoidance

1

Autoparking:具有强化学习功能的自动泊车

自动泊车 Autoparking模拟一个典型的停车场的情况，其目的是重新定位了一系列manuevers的汽车，而附近的避开障碍物。多亏了流行的强化学习算法Q-Learning，我证明了汽车能够自行停车，而无需任何外部输入。一切，包括AI逻辑，都是从头开始用C ++实现的。唯一的依赖关系是开源图形库（）。想更多地了解它的工作原理？观看或阅读简短的。享受！ Autopark训练模型演示目录跑步关于文件夹组织 bin- >包含构建后的可执行二进制文件构建- >包含编译过程中生成的.o目标文件缓存->包含Q和R的预训练权重，因此您可以跳过学习阶段conf- >包含配置文件docs- >包含.pdf文件，其中包含有关该项目的有趣信息。看看吧！字体->包含应用程序使用的几种字体img- >包含上面的gif图像Makefile- >只是一个makefile 自述文

2022-05-05 01:32:45 3.38MB machine-learning reinforcement-learning qlearning ai

1

强化学习入门资料Algorithms for Reinforcement Learning

RLBook资料集锦。强化学习入门资料Algorithms for Reinforcement Learning。强化学习导论和代码实例。中文英文都有。

2022-04-29 18:10:13 59.64MB 强化学习 论文 RL 机器学习

1

Towards Playing Full MOBA Games withDeep Reinforcement Learning.pdf

2022-04-29 15:07:38 4.99MB 人工智能

1

个人信息

热门下载

最新下载

其他资源