增强学习 经典算法 A3C 论文摘要: We propose a conceptually simple and lightweight framework for deep reinforcement learning that uses asynchronous gradient descent for optimization of deep neural network controllers. We present asynchronous variants of four standard reinforcement learning algorithms and show that parallel actor-learners have a stabilizing effect on training allowing all four methods to successfully train neural network controllers. The best performing method, an asynchronous variant of actor-critic, surpasses the current state-of-the-art on the Atari domain while training for half the time on a single multi-core CPU instead of a GPU. Furthermore, we show that asynchronous actor-critic succeeds on a wide variety of continuous motor control problems as well as on a new task of navigating random 3D mazes using a visual input.
2021-11-30 16:51:49 2.2MB RL A3C
1
bayesAB::turtle:bayesAB:用于AB测试的快速贝叶斯方法
2021-11-28 23:47:24 14.29MB cran r bayesian-methods ab-testing
1
COMPUTATIONAL METHODS FOR INVERSE PROBLEMS,反问题的计算方法,国外艾斯维尔出版的关于反问题求解的重要书籍,JPG版本
2021-11-25 14:45:55 8.14MB INVERSE PROBLEMS
1
诺玛Matlab代码用于下行链路协作SWIPT NOMA系统的最优总吞吐量分析的MATLAB代码 关键点: 得出下行协作SWIPT NOMA系统总和的近似封闭式表达式(通过中断概率)。 制定无约束最大化问题,以找到返回最大瞬时系统吞吐量的最佳功率分配比。 使用的Gradient下降方法的MATLAB代码。 用于牛顿法玩具示例的MATLAB代码。 希望您对本材料有所帮助。 如果您对本文有任何意见或讨论,请告诉我。 谢谢你。 抽象的 在本文中,我们研究了在协作同时无线信息和功率传输(SWIPT)非正交多址(NOMA)系统的下行链路情况下小区中心和小区边缘用户的总吞吐量。 具体来说,我们考虑一个两用户NOMA系统,其中小区中心用户充当基于功率分配(PS)的SWIPT中继,旨在提高小区边缘用户的性能。 为了评估所考虑系统的性能,我们首先导出针对小区中心用户的中断概率(OP)的封闭式表达式和针对小区边缘用户的OP的封闭式近似表达式。 然后采用梯度体面方法,提出一种算法,该算法找到PS系数的最佳值,从而使系统的总和吞吐量最大。 借助获得的最佳PS系数,我们表明,最佳SWIPT NOMA系统为小区边
2021-11-22 18:37:54 20KB 系统开源
1
Number-theoretic-Methods-in-Statistics 作者:K.-T. FANG,Y.WANG
2021-11-22 09:19:36 6.93MB 数论方法 统计知识 Number Statis
1
arnoldi算法的MATLAB代码Python-DMD-方法 以下代码将用于动态模式分解(DMD)/ Koopman方法。 代码将具有不同的方法来计算库普曼特征值和众数。 将通过复制学术界的各种论文来对它们进行验证。 目标是用Python(当前使用Matlab)编写这些数值方法。 我目前是UCSB机械工程系MezićGroup的研究员。 当前代码: Arnoldi-Like方法算法。 变异纸:Susuki,Yoshihiko和IgorMezić。 “没有模型的非线性库普曼模式和电力系统稳定性评估。” IEEE Transactions on Power Systems 29.2(2014):899-907。 SVD-DMD算法。 (正在执行)-使用生成的数据编写代码。 精确DMD算法。 (正在处理) 代码使用: 这些代码具有自己的数据文件,特别是来自论文的数据。 我将上载的大多数代码仅要求您放入自己的数据文件(excel文件或mat文件或您使用的任何文件)并运行代码。 自述文件是PDF
2021-11-19 21:29:47 969KB 系统开源
1
有限元方法的国际经典教材,英文教材,高校计算数学专业研究生用书,例如南开大学计算专业使用该书作为教材
2021-11-19 18:44:34 3.06MB 有限元 有限元方法的数学理论
1
区间运算的数学基础,代码的形式化验证常用
2021-11-19 14:20:07 1021KB interval analysis
1
rc代码显着性matlab saliency-detection-methods 文章《基于多图流形排序的图像显着性检测》中所用对比算法源码链接HC: RC: AC: HS: SR: FT: MSS: GS: MR: BFSS: RW: HDCT: BMA: RR:
2021-11-19 11:39:54 869B 系统开源
1
Neural Network Methods in Natural Language Processing 英文epub 本资源转载自网络,如有侵权,请联系上传者或csdn删除 本资源转载自网络,如有侵权,请联系上传者或csdn删除
2021-11-17 14:53:56 2.98MB Neural Network Methods Natural
1