RLDiceGame:强化学习骰子游戏

上传者: 42100129 | 上传时间: 2022-11-10 11:09:53 | 文件大小: 88KB | 文件类型: ZIP
RLDiceGame 介绍 该存储库中的代码实现了一个简单的框架,用于骰子游戏中的强化学习。 强化学习是指能够从反复试验中学习的机器学习框架。 该框架很大程度上归功于马尔可夫决策过程:每个步骤都由一个状态和在该状态下要执行的选定动作来描述。 下一步包含通过对初始状态执行操作而计算出的新状态。 强化学习增加了一种反馈机制,该机制允许所计算的动作响应于外部提供的分数而改变。 增强型学习与监督式学习相反,后者是一种指导机器根据已知分类对状态进行分类的方法,而无监督式学习则是一种无监督学习的方法,后者是一种机器在训练数据中标识自己的集群的方法。 在强化学习中,提供的反馈是基于初始状态和采取的措施的得分。 作为特定示例,Blue Orange Games为流行的骰子游戏Yamslam提供了训练工具。 线束和游戏仅实现一轮Yamslam,包括初始掷出5个6面骰子,决定保留5个初始掷骰子的子集,然后

文件下载

资源详情

[{"title":"( 12 个子文件 88KB ) RLDiceGame:强化学习骰子游戏","children":[{"title":"RLDiceGame-master","children":[{"title":".gitignore <span style='color:#111;'> 713B </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 4.09KB </span>","children":null,"spread":false},{"title":"DiceGen","children":[{"title":"RollIdentifier.py <span style='color:#111;'> 3.51KB </span>","children":null,"spread":false},{"title":"__init__.py <span style='color:#111;'> 86B </span>","children":null,"spread":false},{"title":"DiceGen.py <span style='color:#111;'> 2.69KB </span>","children":null,"spread":false}],"spread":true},{"title":"RLGame","children":[{"title":"__init__.py <span style='color:#111;'> 33B </span>","children":null,"spread":false},{"title":"RLGame.py <span style='color:#111;'> 8.49KB </span>","children":null,"spread":false}],"spread":true},{"title":"Yamslam","children":[{"title":"__init__.py <span style='color:#111;'> 174B </span>","children":null,"spread":false},{"title":"Yamslam.py <span style='color:#111;'> 11.69KB </span>","children":null,"spread":false}],"spread":true},{"title":"YamslamTrain.py <span style='color:#111;'> 6.55KB </span>","children":null,"spread":false},{"title":"YamslamReference_actiontable.dat <span style='color:#111;'> 335.38KB </span>","children":null,"spread":false},{"title":"loadActionTable.R <span style='color:#111;'> 1.33KB </span>","children":null,"spread":false}],"spread":true}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明