这个资源是一个包含了使用 PyTorch 实现的11种常见在线强化学习算法的代码集合。每个算法都有独立的文件夹,可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法: 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)
2024-03-05 21:19:26 6.68MB pytorch 强化学习 python
1
1、Android Android 是一个包括操作系统,中间件以及一些重要应用程序的专门针对移动设备的层次结构的软件集。Android 作为一个完全开源的操作系统,是由操作系统Linux、中间件以及核心应用程序组成的软件栈。通过 android SDK 提供的 API 以及相应的开发工具, 程序员可以很方便的开发android平台上的应用程序。其整个系统由应用程序,应用程序框架,应用程序库,Android运行库,Linux内核(Linux Kernel)五个部分组成。Android操作系统内置了一部分应用程序, 包括电子邮件客户端、SMS程序、日历、地图、浏览器、通讯录以及其他的程序,值得一提的是这些所有的程序都是用java编写的。 移植的主要的工作是驱动,硬件抽象层的移植。为了更好地理解和调试系统,也应该适当地了解上层对硬件抽象层的调用情况。 2、嵌入式LINUX 嵌入式Linux 是将日益流行的Linux操作系统进行裁剪修改,使之能在嵌入式计算机系统上运行的一种操作系统。Linux做嵌入式的优势,首先,Linux是开放源代码;其次,Linux的内核小、效率高
2024-01-18 09:52:34 101KB ARM 操作系统
1
11种人体组织图像数据集,每种有20-50张照片不等。 11种人体组织图像数据集,每种有20-50张照片不等。 11种人体组织图像数据集,每种有20-50张照片不等。
2022-12-06 12:28:49 62.49MB 数据集 组织 图片 深度学习
维修工具图片及打好的标签,共包含3k+张图片,其中十一种类别工具,如扳手,螺丝刀,钳子等等
2022-12-01 17:27:43 84.66MB yolo
1
纯CSS3实现11种超酷Loading动画加载指示器特效源码.zip
2022-11-22 15:23:49 50KB css3
适用经理对员工的的绩效管理,提高管理能力。提供工作效率,有业务,仓库,司机,文员,人事,售后,品检等部门
2022-10-27 18:05:05 121KB 绩效管理
1
1种安卓传感器使用例子集合源码,包括加速度传感器、磁力传感器、方向传感器、陀螺仪传感器、光线感应压力传感器、温度传感器、接近,近距离传感器、重力传感器、线性加速度传感器、旋转矢量传感器等11种安卓手机传感器的使用。
11种数据降维与显示方法,非常实用
2022-10-04 20:05:08 1.79MB 可视化 数据降维
1
运算放大器11种经典应用电路,虚短,虚断熟练应用
2022-09-20 15:21:38 169KB 运算放大器
1
11种效应大全.docx
2022-07-12 12:04:11 23KB 考试