CMU605 大型数据集的机器学习
2022-01-30 23:23:06 283KB Java
1
pytest自动化测试框架学习源码
2022-01-28 09:02:50 4.15MB 自动化 python pytest自动化测试框架 pytest
从头开始训练机器人手臂 :建立培训框架 :学习从头开始构建环境 :完成基本的环境脚本,看看手臂如何运动 :插入强化学习方法并尝试对其进行培训 :优化和调试 :制定目标 依存关系 Python 张量流 g 麻木 此强化学习练习代码​​的中文教程为 。 您可以在上查看更多教程,或在了解有关我的更多信息。
1
C语言学习,适合小白C语言的学习,属于一看就懂的。
2022-01-18 22:22:20 4.95MB C语言学习
1
基于深度强化学习的编队控制使用MADDPG算法
2022-01-18 14:59:03 11KB 编队控制学习 MADDPG 编队控制 编队
1
CausalInference.jl:使用PC算法进行因果推理,图形模型和结构学习
2022-01-14 15:59:11 42KB julia causal-inference TheJuliaLanguageJulia
1
Udacity深度强化学习纳米学位-项目3:合作与竞争 介绍 对于这个Udacity项目,我使用了一个DDPG代理来解决多代理协作环境。 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或越界将球击中,则其收益为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 该任务是情节性的,并且为了解决环境,您的特工必须获得+0.5的平均分数(在两个特工均取得最大分值之后,连续100次以上)。 具体来说, 在每个情节之后,我们将汇总每个代理商的奖励(不打折),以获得每个代理商的得分。 这将产生2个(可能不同)的分数。 然后,我们取这两个分数中的最大值。 这为每
2022-01-13 16:41:31 1.06MB JupyterNotebook
1
学习springboot过程中的代码
2022-01-02 14:04:06 2.99MB Spring springboot maven mybatis
1
Python 基础教程Python高级编程机器学习深度学习实例学习源码优化算法源码等收集的好用教程源码打包下载。
2021-12-31 09:06:24 9.11MB Python基础教程Pytho
无监督学习
2021-12-29 16:56:32 8KB Python
1