facebook 在机器的 VizDoom 比赛中得到了第一名,其中涉及到了强化学习在sparse reward的环境中使用Reward Shaping和Curriculum Learning的技巧。
2021-04-19 19:05:57 1.16MB 强化学习 RewardShaping CurriculumLearn VizDoom
1