frozen-lake:在游戏《冰湖》中测试的Q学习算法

上传者: 42150745 | 上传时间: 2022-05-17 15:28:25 | 文件大小: 175KB | 文件类型: ZIP
Q学习的冰冻湖 Q-Learning算法已在游戏《冰湖》中进行测试。 技术 该项目是通过使用nodejs和electronic的javascript实现的。 这个怎么运作 该游戏与gym.openai 相同 在这个游戏中,特工必须经过抽签才能达到目标“ G”并获得1分的奖励,否则将不给予奖励。 它可以从四个要在环境中执行的动作中进行选择,这些动作是:左移,右移,向上和向下。 字母“ S”是安全的起始位置,字母“ F”是冻结的表面,也很安全。 如果特工发现一个“ H”洞,它将掉落,结束游戏并开始下一个情节。 由于湖的表面被冻结了,特工有机会滑倒并滑到不想去的位置。 结果 通过项目中使用的参数,获得了Q表。 这是最终的Q表,代表了座席在培训阶段所获得的经验。 每一列都是业务代表根据状态可立即获得以及将来获得的奖励(向左,向右,向上和向下)采取该行动的概率。 正如所言。 而且每

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明