AI-奥林匹克·相扑比赛基于规则的智能体和基于强化学习的智能体解决方案,该方案训练出的智能体能进入对战排行榜前十。基于代码实现的规则,能进入排行榜前三。 1 手动提取特征(manual feature extraction) 2 重新封装环境 3 训练表现
2022-10-16 22:08:12 7.81MB 强化学习 AI-奥林匹克 相扑比赛 PPO
1