网球数据集 机器学习决策树练习用
2021-04-03 18:12:44 333B 机器学习
1
DRL-网球统一 项目详情 这是Udacity深度强化学习纳米学位的最终项目。 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或将球击出界外,则其获得的奖励为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 该任务是情节性的,并且为了解决环境,您的特工必须获得+0.5的平均分数(在连续两次情节达到最高分后,在两个特工中均取得了最高分) 这些是此Unity环境的一些细节: INFO:unityagents: 'Academy' started successfully! Unity Academy name: Academy Numb
2021-03-02 11:07:30 157KB JupyterNotebook
1
tsb 网球计分板
2021-02-19 09:05:48 3KB
1
一个java3d网球游戏的源代码 一个java3d网球游戏的源代码
2019-12-21 22:21:26 5.54MB java 3d 网球 源代码
1