只为小站
首页
域名查询
文件下载
登录
iw-transfer-rl:论文《强化学习中样本的重要性加权转移》(ICML 2018)的代码
强化学习中样本的重要性加权转移 此存储库包含我们的强化学习中的重要性加权样本转移》的代码,该代码已在ICML 2018上接受。我们提供了一个小库,用于RL中的样本转移(名为TRLIB),包括重要性加权拟合Q的实现-迭代(IWFQI)算法[1]以及有关如何重现本文提出的实验的说明。 抽象的 我们考虑了从一组源任务中收集的强化学习(RL)中经验样本(即元组
)的转移,以改善给定目标任务中的学习过程。 大多数相关方法都专注于选择最相关的源样本来解决目标任务,但随后使用所有已转移的样本,而无需再考虑任务模型之间的差异。 在本文中,我们提出了一种基于模型的技术,该技术可以自动估计每个源样本的相关性(重要性权重)以解决目标任务。 在所提出的方法中,所有样本都通过批处理RL算法转移并用于解决目标任务,但它们对学习过程的贡献与它们的重要性权重成正比。 通过扩展监督学习文献中提供的重要性加
2025-04-02 21:44:35
4.92MB
machine-learning
reinforcement-learning
transfer-learning
Python
1
基于加权加速度均方根值分析的汽车平顺性MATLAB代码实现:新国标下的计算方法与输出结果,基于Matlab代码的汽车平顺性分析:新国标下加权加速度均方根值计算方法及输出结果分析,加权加速度均方根值 m
基于加权加速度均方根值分析的汽车平顺性MATLAB代码实现:新国标下的计算方法与输出结果,基于Matlab代码的汽车平顺性分析:新国标下加权加速度均方根值计算方法及输出结果分析,加权加速度均方根值 matlab代码 汽车平顺性分析 新国标下的加权加速度均方根值计算 输入为加速度样本 输出加速度功率谱密度 以及加权加速度均方根 ,加权加速度; 均方根值; MATLAB代码; 汽车平顺性分析; 新国标计算; 输入样本; 输出功率谱密度; 加权加速度均方根值,新国标下汽车平顺性分析的加权加速度均方根值计算与Matlab代码实现
2025-04-02 09:57:38
1.07MB
1
【图像融合】基于matlab小波变换(加权平均法+局域能量+区域方差匹配)图像融合【含Matlab源码 1819期】.md
【图像融合】基于matlab小波变换(加权平均法+局域能量+区域方差匹配)图像融合【含Matlab源码 1819期】.md
2024-11-30 17:05:13
9KB
1
双色球EXCEL全攻略6-9加权式旋转矩阵3+12中6保5.pdf
双色球EXCEL全攻略6-9加权式旋转矩阵3+12中6保5.pdf
2024-10-28 16:34:25
62KB
1
广义互相关时延估计估计GCC(Roth加权、SCOT加权、PHAT加权、ML加权)
1.包括广义互相关时延估计GCC几种加权方式(Roth加权、SCOT加权、PHAT加权、ML加权)的详细代码(MATLAB) 2.代码有很详细的注释,很有参考价值,每一种加权方法都有详细的代码 3.希望能帮助大家更好的理解广义互相关时延估计
2024-05-09 20:13:44
92KB
matlab
GCC
时延估计
Roth
1
600块的加权马尔可夫预测代码
别人当初花600块让我给写的马尔可夫预测代码,步骤详细,包教包会,你只要看完一遍,基本上就会加权马尔可夫预测了。
2024-03-27 21:14:58
913KB
1
对称性与Sobolev嵌入
建立了一个Sobolev空间上部分对称函数到加权Lp空间的嵌入定理,并给出这一定理对具临界增长非线性椭圆边值问题的应用。过去这类结论主要是关于Holder函数的,笔者将这一结论推广到连续函数。
2024-03-02 09:09:55
156KB
部分对称
加权函数空间
临界Sobolev指标
1
Looijenga的加权射影空间,Tate算法和F理论和杂散弦论中的Mordell-Weil格
现在众所周知,用于将异质弦压缩到四个维度的矢量束的模空间是通过一组特殊类型的加权射影空间束的一组截面进行参数化的,称为Looijenga的加权射影空间束。 我们表明,可以获得必要的加权投影空间和描述规范组EN(N = 4,···,8)和SU(n + 1)(n = 1,2,3)的光谱覆盖的Weierstrass方程 根据泰特(Tate)算法,通过一系列的爆破程序系统地进行系统化处理,从而可以自动获得由Looijenga定理提出的正确线束的截面。 它们不过是参数化复杂结构的六维F理论中独立多项式集合的四维类似物,这在D 4,A 5,D 6,E 3和SU( 2)×SU(2)束。 我们还将解释为什么我们可以通过使用Mordell-Weil格的结构定理以这种方式获得它们,这对于理解F理论中奇异性与手性物质的出现之间的关系也很有用。
2024-03-01 23:03:20
507KB
Open
Access
1
基于时间加权-新陈代谢GM(1,1)模型在建筑物沉降预测中的应用
文中针对时间因素对GM(1,1)模型预测造成的影响引入了时间加权-新陈代谢GM(1,1)模型,并将该模型应用于建筑物的沉降预测,结果证明时间加权-新陈代谢GM(1,1)模型比传统的GM(1,1)模型的预测精度高,具有较高的参考价值。
2024-02-28 15:49:35
655KB
沉降观测
灰色理论
沉降预测
GM(1
1
降采样率A加权
vi,NI程序,降采样率A加权,使用NI系统测试时候可以借鉴
2024-01-24 19:32:00
727KB
降采样率加权
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Spring相关的外文文献和翻译(毕设论文必备)
西门子逻辑控制设计开发_3部10层
Plex v7.12电视端app
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
基于hadoop商品推荐系统课程设计
MPC 模型预测控制matlab仿真程序
Spring相关的外文文献和翻译(含出处).zip
多智能体的编队控制程序的补充(之前上传少了一个文件)
全国道路网SHP数据.zip
现代操作系统原理与实现.pdf
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
基于Matlab的IEEE14节点潮流计算.zip
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
拾荒者.exe同时ID扫描器IP扫描器
基于Python网络爬虫毕业论文.doc
最新下载
冬至盘版排盘软件YiPaiPan3.0—易排盘V3.0.zip
联想G460 2.15 BIOS 64位
3DSlicer 5.2带中文包-稳定版
COMSOL中金纳米颗粒光热效应仿真:波动光学与固体传热耦合的技术解析及应用
超想汉字系统4.0
SIMATIC-S7FPROJX-V5-5-SP13-Upd1.exe
AStyle_3.1_windows.7z
Q5 Q9 Q11对讲机写频软件和教程.zip
卡尔曼滤波算法及C语言的实现
MZ803-V3.2.2全功能去控.7z
其他资源
几个flash动画作品带源文件
实用Excel进销存管理表格.XLSM
UML建模 医院管理系统
考研复试整理.pdf
64QAM调制解调
设计模式单例模式和工厂模式综合应用
机器码修改神奇
计算任意两个城市之间的距离
secureCRT8.5注册机
工业图像异物检测
JavaEE编写的学生选课系统
UMP插件工具
红外图像处理、分析与融合
SHLWallet.exe 修订
湖南大学操作系统实验课第二次节点考核工程(95分)-18级老学姐
C语言小游戏 扫雷.rar
Redis.xmind
php简单的博客程序
电子计算机算法手册,高清PDF格式
otsu二值化c代码
Koreographer-Unity的音乐插件Plus版
Flink流式计算实际生产项目代码
UML网上书店(系统)
接口签名算法设计、MD5签名算法
hg255d_固件合集