强化学习中样本的重要性加权转移 此存储库包含我们的强化学习中的重要性加权样本转移》的代码,该代码已在ICML 2018上接受。我们提供了一个小库,用于RL中的样本转移(名为TRLIB),包括重要性加权拟合Q的实现-迭代(IWFQI)算法[1]以及有关如何重现本文提出的实验的说明。 抽象的 我们考虑了从一组源任务中收集的强化学习(RL)中经验样本(即元组)的转移,以改善给定目标任务中的学习过程。 大多数相关方法都专注于选择最相关的源样本来解决目标任务,但随后使用所有已转移的样本,而无需再考虑任务模型之间的差异。 在本文中,我们提出了一种基于模型的技术,该技术可以自动估计每个源样本的相关性(重要性权重)以解决目标任务。 在所提出的方法中,所有样本都通过批处理RL算法转移并用于解决目标任务,但它们对学习过程的贡献与它们的重要性权重成正比。 通过扩展监督学习文献中提供的重要性加
1
基于加权加速度均方根值分析的汽车平顺性MATLAB代码实现:新国标下的计算方法与输出结果,基于Matlab代码的汽车平顺性分析:新国标下加权加速度均方根值计算方法及输出结果分析,加权加速度均方根值 matlab代码 汽车平顺性分析 新国标下的加权加速度均方根值计算 输入为加速度样本 输出加速度功率谱密度 以及加权加速度均方根 ,加权加速度; 均方根值; MATLAB代码; 汽车平顺性分析; 新国标计算; 输入样本; 输出功率谱密度; 加权加速度均方根值,新国标下汽车平顺性分析的加权加速度均方根值计算与Matlab代码实现
2025-04-02 09:57:38 1.07MB
1
【图像融合】基于matlab小波变换(加权平均法+局域能量+区域方差匹配)图像融合【含Matlab源码 1819期】.md
2024-11-30 17:05:13 9KB
1
双色球EXCEL全攻略6-9加权式旋转矩阵3+12中6保5.pdf
2024-10-28 16:34:25 62KB
1
1.包括广义互相关时延估计GCC几种加权方式(Roth加权、SCOT加权、PHAT加权、ML加权)的详细代码(MATLAB) 2.代码有很详细的注释,很有参考价值,每一种加权方法都有详细的代码 3.希望能帮助大家更好的理解广义互相关时延估计
2024-05-09 20:13:44 92KB matlab GCC 时延估计 Roth
1
别人当初花600块让我给写的马尔可夫预测代码,步骤详细,包教包会,你只要看完一遍,基本上就会加权马尔可夫预测了。
2024-03-27 21:14:58 913KB
1
建立了一个Sobolev空间上部分对称函数到加权Lp空间的嵌入定理,并给出这一定理对具临界增长非线性椭圆边值问题的应用。过去这类结论主要是关于Holder函数的,笔者将这一结论推广到连续函数。
1
现在众所周知,用于将异质弦压缩到四个维度的矢量束的模空间是通过一组特殊类型的加权射影空间束的一组截面进行参数化的,称为Looijenga的加权射影空间束。 我们表明,可以获得必要的加权投影空间和描述规范组EN(N = 4,···,8)和SU(n + 1)(n = 1,2,3)的光谱覆盖的Weierstrass方程 根据泰特(Tate)算法,通过一系列的爆破程序系统地进行系统化处理,从而可以自动获得由Looijenga定理提出的正确线束的截面。 它们不过是参数化复杂结构的六维F理论中独立多项式集合的四维类似物,这在D 4,A 5,D 6,E 3和SU( 2)×SU(2)束。 我们还将解释为什么我们可以通过使用Mordell-Weil格的结构定理以这种方式获得它们,这对于理解F理论中奇异性与手性物质的出现之间的关系也很有用。
2024-03-01 23:03:20 507KB Open Access
1
文中针对时间因素对GM(1,1)模型预测造成的影响引入了时间加权-新陈代谢GM(1,1)模型,并将该模型应用于建筑物的沉降预测,结果证明时间加权-新陈代谢GM(1,1)模型比传统的GM(1,1)模型的预测精度高,具有较高的参考价值。
2024-02-28 15:49:35 655KB 沉降观测 灰色理论 沉降预测 GM(1
1
vi,NI程序,降采样率A加权,使用NI系统测试时候可以借鉴
2024-01-24 19:32:00 727KB 降采样率加权
1