只为小站
首页
域名查询
文件下载
登录
iw-transfer-rl:论文《强化学习中样本的重要性
加权
转移》(ICML 2018)的代码
强化学习中样本的重要性
加权
转移 此存储库包含我们的强化学习中的重要性
加权
样本转移》的代码,该代码已在ICML 2018上接受。我们提供了一个小库,用于RL中的样本转移(名为TRLIB),包括重要性
加权
拟合Q的实现-迭代(IWFQI)算法[1]以及有关如何重现本文提出的实验的说明。 抽象的 我们考虑了从一组源任务中收集的强化学习(RL)中经验样本(即元组
)的转移,以改善给定目标任务中的学习过程。 大多数相关方法都专注于选择最相关的源样本来解决目标任务,但随后使用所有已转移的样本,而无需再考虑任务模型之间的差异。 在本文中,我们提出了一种基于模型的技术,该技术可以自动估计每个源样本的相关性(重要性权重)以解决目标任务。 在所提出的方法中,所有样本都通过批处理RL算法转移并用于解决目标任务,但它们对学习过程的贡献与它们的重要性权重成正比。 通过扩展监督学习文献中提供的重要性加
2025-04-02 21:44:35
4.92MB
machine-learning
reinforcement-learning
transfer-learning
Python
1
基于
加权
加速度均方根值分析的汽车平顺性MATLAB代码实现:新国标下的计算方法与输出结果,基于Matlab代码的汽车平顺性分析:新国标下
加权
加速度均方根值计算方法及输出结果分析,
加权
加速度均方根值 m
基于
加权
加速度均方根值分析的汽车平顺性MATLAB代码实现:新国标下的计算方法与输出结果,基于Matlab代码的汽车平顺性分析:新国标下
加权
加速度均方根值计算方法及输出结果分析,
加权
加速度均方根值 matlab代码 汽车平顺性分析 新国标下的
加权
加速度均方根值计算 输入为加速度样本 输出加速度功率谱密度 以及
加权
加速度均方根 ,
加权
加速度; 均方根值; MATLAB代码; 汽车平顺性分析; 新国标计算; 输入样本; 输出功率谱密度;
加权
加速度均方根值,新国标下汽车平顺性分析的
加权
加速度均方根值计算与Matlab代码实现
2025-04-02 09:57:38
1.07MB
1
【图像融合】基于matlab小波变换(
加权
平均法+局域能量+区域方差匹配)图像融合【含Matlab源码 1819期】.md
【图像融合】基于matlab小波变换(
加权
平均法+局域能量+区域方差匹配)图像融合【含Matlab源码 1819期】.md
2024-11-30 17:05:13
9KB
1
双色球EXCEL全攻略6-9
加权
式旋转矩阵3+12中6保5.pdf
双色球EXCEL全攻略6-9
加权
式旋转矩阵3+12中6保5.pdf
2024-10-28 16:34:25
62KB
1
广义互相关时延估计估计GCC(Roth
加权
、SCOT
加权
、PHAT
加权
、ML
加权
)
1.包括广义互相关时延估计GCC几种
加权
方式(Roth
加权
、SCOT
加权
、PHAT
加权
、ML
加权
)的详细代码(MATLAB) 2.代码有很详细的注释,很有参考价值,每一种
加权
方法都有详细的代码 3.希望能帮助大家更好的理解广义互相关时延估计
2024-05-09 20:13:44
92KB
matlab
GCC
时延估计
Roth
1
600块的
加权
马尔可夫预测代码
别人当初花600块让我给写的马尔可夫预测代码,步骤详细,包教包会,你只要看完一遍,基本上就会
加权
马尔可夫预测了。
2024-03-27 21:14:58
913KB
1
对称性与Sobolev嵌入
建立了一个Sobolev空间上部分对称函数到
加权
Lp空间的嵌入定理,并给出这一定理对具临界增长非线性椭圆边值问题的应用。过去这类结论主要是关于Holder函数的,笔者将这一结论推广到连续函数。
2024-03-02 09:09:55
156KB
部分对称
加权函数空间
临界Sobolev指标
1
Looijenga的
加权
射影空间,Tate算法和F理论和杂散弦论中的Mordell-Weil格
现在众所周知,用于将异质弦压缩到四个维度的矢量束的模空间是通过一组特殊类型的
加权
射影空间束的一组截面进行参数化的,称为Looijenga的
加权
射影空间束。 我们表明,可以获得必要的
加权
投影空间和描述规范组EN(N = 4,···,8)和SU(n + 1)(n = 1,2,3)的光谱覆盖的Weierstrass方程 根据泰特(Tate)算法,通过一系列的爆破程序系统地进行系统化处理,从而可以自动获得由Looijenga定理提出的正确线束的截面。 它们不过是参数化复杂结构的六维F理论中独立多项式集合的四维类似物,这在D 4,A 5,D 6,E 3和SU( 2)×SU(2)束。 我们还将解释为什么我们可以通过使用Mordell-Weil格的结构定理以这种方式获得它们,这对于理解F理论中奇异性与手性物质的出现之间的关系也很有用。
2024-03-01 23:03:20
507KB
Open
Access
1
基于时间
加权
-新陈代谢GM(1,1)模型在建筑物沉降预测中的应用
文中针对时间因素对GM(1,1)模型预测造成的影响引入了时间
加权
-新陈代谢GM(1,1)模型,并将该模型应用于建筑物的沉降预测,结果证明时间
加权
-新陈代谢GM(1,1)模型比传统的GM(1,1)模型的预测精度高,具有较高的参考价值。
2024-02-28 15:49:35
655KB
沉降观测
灰色理论
沉降预测
GM(1
1
降采样率A
加权
vi,NI程序,降采样率A
加权
,使用NI系统测试时候可以借鉴
2024-01-24 19:32:00
727KB
降采样率加权
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
大唐杯资料+题库(移动通信)
Vivado license 永久
sqlite运行所需Vc++运行环境,纯净版System.Data.SQLite.dll及SQLite.Interop.dll
张正友相机标定Opencv实现(完整程序+棋盘图)实例源码
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
《应用非线性控制》(美)斯洛坦著;程代展译(清晰)
工程伦理_李正风,丛杭青,王前_北京:清华大学出版社 , 2016.08_P329.pdf
RentingSystem.rar
毕业设计:基于Python的网络爬虫及数据处理(智联招聘)
DBSCAN算法Matlab实现
BP神经网络+PID控制simulink仿真
simulink仿真实现光伏发电MPPT+能量管理
知网情感词典(HOWNET)
transformer_pytorch_inCV.rar
基于matlab扩频通信系统仿真(整套代码)
最新下载
AppleConfigurator2.dmg
小纸片全套网络验证源码(包含脱壳)
开源电商平台源码smartShop
k210视频循迹的一种方法
COMDLG32.OCX
振弦传感器监测装置设计及原理解析.zip
kodexplorer4.4版本完美修改版.zip
BMP图像文件读写操作类,C++实现,支持24位位图
傻瓜进销存完美破解
ds180_7Series_Overview.pdf
其他资源
淘宝客导购小程序V2.0.8 前端+后端 新版上线
最全HZK12,HZK16,HZK24,HZK32,HZK40,HZK48,ASC12, ASC16,ASC24, ASC32, ASC48字库+读取代码
towince.exe.软件
S7-200Smart 经典案例(入门篇).rar
模糊自适应整定PID控制程序FUZZY-PID
基于JM8.6的H.264编解码器代码工程(注释)
计算机病毒与防范技术课件-清华版
Android可用的RecyclerView各个版本(21.0.0~26.0.0)
MFC WINSOCKET多线程编程实例
数学建模与数学实验_汪晓银_周保平电子书及程序源码
大学生《电力系统分析》习题集.pdf
ttt-7-有效-移动-bootcamp-prep-000-源码
大数据基础-Linux基础详解课程12.远程连接服务器.mp4
mysql-5.5.13-win32.zip
拟牛顿法程序
J2ME游戏开发教程 pdf文件
目标跟踪系统的MATLAB 源程序包
DevComponents.DotNetBar破解全集,其中有个含商业源码
语音信号短时能量
别踩白块儿 源码
802.3av-2009
高通vuforia-unity-6-2-10.unitypackage