强化学习 您可以在此处找到强化学习 Matlab 中的项目。 TP1:策略评估、策略迭代、价值迭代、Q-learning TP2:多臂强盗,汤普森采样
2022-05-19 14:50:39 1.12MB TeX
1
永不放弃 永不放弃的PyTorch实施:学习定向探索策略[] 仅实施了具有嵌入网络的偶然性好奇心。 安装 使用Python 3.7.9测试 pip install -r requirements.txt 火车 python train.py 结果 5x5结果 学分 R2D2基地是从通过
1
AI游戏 use AI to play some games. You can star this repository to keep track of the project if it's helpful for you, thank you for your support. 内容 名称 实施算法的数量 码 用中文(表达 AISnake 2 AI贪吃蛇 车手 1个 AI俄罗斯方块 五子棋 1个 AI五子棋 AITRexRush 3 AIChrome浏览器小恐龙游戏 爱庞 1个 AI乒乓球 AIPianoTiles 1个 AI别再踩白块了 艾帕克曼 1个 AI吃豆人 AIFlappyBird 2 AI飞扬的小鸟 更多 微信公众号 查尔斯·皮卡丘
2022-05-12 14:55:24 527.53MB game algorithm reinforcement-learning ai
1
IEEE COMMUNICATIONS SURVEYS & TUTORIALS, VOL. 21, NO. 4, FOURTH QUARTER 2019 Nguyen Cong Luong , Dinh Thai Hoang , Member, IEEE, Shimin Gong , Member, IEEE, Dusit Niyato , Fellow, IEEE,PingWang , Senior Member, IEEE, Ying-Chang Liang , Fellow, IEEE, and Dong In Kim , Fellow, IEEE
2022-05-09 17:14:09 5.17MB 强化学习 综述 通信和网络
1
很棒的蒙特卡洛树搜索论文。 ⠀ ⠀⠀ 蒙特卡罗树搜索论文的精选列表,其中包含来自以下会议/期刊的实现: 机器学习 计算机视觉 自然语言处理 数据 人工智能 UAI 机器人RAS 游戏CIG 关于图分类、梯度提升、分类/回归树、欺诈检测和社区检测论文的类似集合以及实现。 2021年 学习停止:动态模拟蒙特卡罗树搜索(AAAI 2021) Li-Cheng Lan, Ti-Rong Wu, I-Chen Wu, Cho-Jui Hsieh [纸] Dec-SGTS:多代理协调的分散子目标树搜索(AAAI 2021) 李明龙、蔡忠轩、杨文静、吴丽霞、徐颖慧、王季 [纸] 改进的 POMDP 树搜索规划与优先行动分支 (AAAI 2021) 约翰·默恩、阿尼尔·耶尔迪兹、劳伦斯·布什、Tapan Mukerji、Mykel J. Kochenderfer [纸]
1
金融交易的强化学习? 如何使用 MATLAB 使用模拟股票数据将强化学习用于金融交易。 设置跑步: 打开 RL_trading_demo.prj 打开工作流.mlx 运行工作流.mlx 环境和奖励可以在:myStepFunction.m 中找到 概述: 强化学习代理的目标很简单。 了解如何在不损失资金的情况下进行金融市场交易。 请注意,这与学习如何交易市场并尽可能多地赚钱不同。 这个例子的目的是展示: 1.什么是强化学习2. 如何将其应用于金融市场交易3. 为金融专业人士留下一个起点,让他们利用自己的领域专业知识来使用和增强。 该示例使用的环境由 3 只股票、20000 美元现金和 15 年的历史数据组成。 股票是: 通过几何布朗运动或历史市场数据(来源:AlphaVantage: www.alphavantage.co ) 版权所有2020 The MathWorks,
2022-05-06 05:23:29 3.97MB matlab
1
cadrl_ros(使用Deep RL避免冲突) 用Deep RL训练的动态避障算法的ROS实现 纸: M.Everett,Y.Chen和JP How,《具有深度强化学习的动态决策代理之间的运动计划》,IEEE / RSJ国际智能机器人和系统会议(IROS),2018年 论文: : 视频: : Bibtex: @inproceedings{Everett18_IROS, address = {Madrid, Spain}, author = {Everett, Michael and Chen, Yu Fan and How, Jonathan P.}, bookti
1
自动泊车 Autoparking模拟一个典型的停车场的情况,其目的是重新定位了一系列manuevers的汽车,而附近的避开障碍物。 多亏了流行的强化学习算法Q-Learning,我证明了汽车能够自行停车,而无需任何外部输入。 一切,包括AI逻辑,都是从头开始用C ++实现的。 唯一的依赖关系是开源图形库( )。 想更多地了解它的工作原理? 观看或阅读简短的。 享受! Autopark训练模型演示 目录 跑步 关于 文件夹组织 bin- >包含构建后的可执行二进制文件构建- >包含编译过程中生成的.o目标文件缓存->包含Q和R的预训练权重,因此您可以跳过学习阶段conf- >包含配置文件docs- >包含.pdf文件,其中包含有关该项目的有趣信息。 看看吧! 字体->包含应用程序使用的几种字体img- >包含上面的gif图像Makefile- >只是一个makefile 自述文
1
RLBook资料集锦。 强化学习入门资料Algorithms for Reinforcement Learning。 强化学习导论和代码实例。 中文英文都有。
2022-04-29 18:10:13 59.64MB 强化学习 论文 RL 机器学习
1
Towards Playing Full MOBA Games withDeep Reinforcement Learning.pdf
2022-04-29 15:07:38 4.99MB 人工智能
1