基于Pytorch实现的DQN算法,环境是基于CartPole-v0的。在这个程序中,复现了整个DQN算法,并且程序中的参数是调整过的,直接运行。 DQN算法的大体框架是传统强化学习中的Q-Learning,只不过是Q-learning的深度学习版本。DQN的改进主要有三个: 1. DQN的行为值函数利用神经网络逼近; 2. DQN维护一个回放缓冲区,将每次从环境中采样得到的四元组数据存储到回放缓冲区中,训练 Q 网络的时候再从回放缓冲区中随机采样若干数据来进行训练; 3. DQN使用目标网络,使得算法的训练更加稳定。
2022-07-14 12:08:28 8KB DQN 强化学习 CartPole Pytorch
1
普通的 DQN 算法通常会导致对值的过高估计,通过神经网络估算的Q值本身在某些时候会产生正向或负向的误差,在 DQN 的更新方式下神经网络会将正向误差累积。对于动作空间较大的任务,DQN 中的过高估计问题会非常严重,造成 DQN 无法有效工作的后果。 为了解决这一问题,Double DQN 算法提出利用两个独立训练的神经网络估算值函数,将训练网络作为 Double DQN 算法中的第一套神经网络来选取动作,将目标网络作为第二套神经网络计算值,极大的缓解了DQN过估计的问题。 这个程序完整实现了DoubleDQN算法,并且在Pendulum-v0环境上验证了过估计问题,可以从实验结果中看出,DoubleDQN确实缓解了DQN的过估计问题。
2022-07-14 12:08:28 11KB 强化学习 过估计 DQN DoubleDQN
1
源码介绍: 最新自适应版易支付聚合支付源码 带代理 带推广 最新聚合支付系统源码,第三方第四方支付系统,自适应手机版 PHP聚合支付带代理功能(附带DEMO和API文档), 全响应式前端界面,简约易操作,安全便利快捷,为你稳定服务。 功能包括资金记录、订单记录、收益统计和渠道分析 支持代付功能多级分销代理, 支持支付宝、微信原生官方接口, 原生官方无需上游即可完成通道; 标价包含安装和指导,指导后台默认如何配置帐号费率,视需求而定; 短信接口已对接,如需注册申请阿里的短信接口 代码已经能稳定运行
2022-07-14 11:06:14 113.59MB 易支付聚合支付源码
数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型数字化时代自适应供应链转型
2022-07-14 10:03:56 5.5MB 数字化时代自适应供应链转型
基于全变差图像去噪经典算法,提出一种自适应保真项的数值实现算法.该算法利用图像纹理区和光滑区中噪声的不同特点,采用不同去噪强度避免传统方法的不足,并以数值方法实现.在保持经典算法去噪效果的前提下,解决了原有阶梯效应和过度平滑的问题,尤其对精致的纹理和细节图像,使其在去噪的同时,不丢失图像特点.该方法处理相对简单,可应用于以偏微分方程为基础的图像处理.
2022-07-14 01:16:08 919KB 自然科学 论文
1
Winform实现窗体内嵌入第三方应用窗体,只需要知道窗体名称,即可将第三方应用的窗体嵌入到自己的程序中,使用WinForm的Panel控件作为其父容器,并且第三方窗体仍然保持原有的功能,如点击,输入等,可以随着自己的应用最大最小化,作为自己应用的一部分存在。 这一版优化了很长时间,为了实现在父容器大小改变时,第三方应用的大小可以自适应,网上的很多做法都会造成卡顿或者闪烁,最后是我结合实际应用,自己总结经验写出了这一版无卡顿,闪烁少的代码,实属不易,希望大家能够支持。 使用时记得更改后台代码里面的windowName参数。 需要提前打开第三方程序,或者使用C#代码打开第三方程序后,点击嵌入窗体按钮,将第三方窗体嵌入自己窗体的Panel中,如果你的窗体,容器大小不会改变,可以不设置timer,这样能避免闪烁现象发生。
2022-07-13 22:42:09 161KB c# winform wpf 窗体嵌入
1
(实战)[re:Invent 2018]-001:赛道分析-(致敬1024) 配套资料
2022-07-13 21:09:52 4.68MB 强化学习
1
CS285 Deep Reinforcement Learning 2021 Lecture Slides UCL的深度强化学习课程的PPT
2022-07-13 21:07:30 2.67MB 深度强化学习
1
主要功能: 1.颠覆传统,增加产品型号、产品尺寸、产品颜色等产品多选项选择,满足亲们多样需求 2.超乎想象,自带十六种可自适应电脑站和手机站的样式,一套源码解决亲PC端、WAP端使用订单系统问题,全部为全新界面,更加美观、大气 3.带邮件提醒+手机短信提醒{手机邮箱开启短信提示功能即可},特别增强对将QQ邮箱设置为订单发件箱的支持;邮件标题进一步优化,显示订单编号、姓名、联系方式 4.产品套餐选择支持单选、复选、下拉选择,迎合亲们的各种喜好 5.带订单来路页面和下单页面地址检测 6.支持下单人IP追踪 7.支持设置同一IP下单间隔时间,防重复提交;增强恶意空单拦截,有效应对恶意客户拦截传递过程中的订单信息后提交空单行为 8.升级优化邮件系统内核到最新 9.对空间要求更宽泛,fsockopen、pfsockopen和stream_socket_client三个函数只需要开一个即可使用,支持绝大多数的PHP空间 10.相关提示更加人性化,拥有本订单系统的亲们能根据错误提示快速明了订单系统无法正常工作的原因,方便对解决问,迅速安装配置 11、增强支付宝付款接口,在支付宝业务调整,免签接口失效
2022-07-13 16:07:29 2.47MB PHP在线订单系统源码
安装说明: 1、上传到网站根目录 2、用phpMyadmin导入数据库文件yun_fwdl.sql 3、修改数据库链接文件 data/conn.php (记得不要用记事本修改,否则可能会出现验证码显示不了问题,建议用Notepad++) 4、后台地址 http://您域名/admin 帐号 admin 密码 admin8883
2022-07-13 16:07:19 7.09MB 授权查询系统源码