搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

癌症是一种复杂的疾病，通过增加收集的数据量和部署的计算能力来帮助人们理解和治疗癌症。因此，越来越需要开发数据驱动的深度学习方法，尤其是用于癌症诊断、检测、预后和预测等各种任务的深度学习方法。然而，尽管最近取得了成功，但为非图像和非文本癌症数据设计高性能的深度学习模型是一项耗时、反复尝试的手动任务，需要癌症领域和深度学习专业知识。为此，我们开发了一种基于强化学习的神经架构搜索，以自动匹配基于深度学习的预测模型开发，用于一类具有代表性的癌症数据。我们开发定制的构建块，允许领域专家结合癌症数据的特定特征。我们表明，我们的方法发现了深度神经网络结构，其可训练参数明显较少，训练时间较短，精确度与手动设计的结构相似或更高。我们在Argonne Leader ship Computing Facility的Theta超级计算机的多达1024个Intel Knights着陆节点上研究并演示了我们方法的可扩展性。我们开发了可扩展的基于RL的NAS，以自动化一类癌症数据的DNN模型开发。我们设计了一个NAS搜索空间，该空间考虑了特定于非图像和非文本癌症数据的特征。我们在多达1024个Intel Kni

2022-02-01 18:02:38 1.87MB 深度学习 架构 dnn 自动化

室内环境下自主移动机器人导航的深度强化学习

-深度强化学习已成功应用于各种电脑游戏[8]。然而，它在实际应用中仍然很少使用，尤其是在实际移动机器人的导航和连续控制中[13]。以前的方法缺乏安全性和鲁棒性，并且/或者需要一个结构化的环境。在本文中，我们提出了一种在未知环境下，无地图或规划器的真实机器人自主自学习导航的概念证明。机器人的输入仅仅是来自2D激光扫描仪和RGB-D相机的融合数据，以及目标的方向。环境地图是未知的。异步网络（GA3C）的输出动作是机器人的线性速度和角速度。导航/控制器网络在一个高速、并行、自实现的仿真环境中进行预训练，以加快学习过程，然后部署到实际机器人上。为了避免过度拟合，我们训练相对较小的网络，并向输入激光数据中添加随机高斯噪声。传感器数据与RGB-D摄像头的融合使机器人能够在真实环境中进行导航，实现真正的3D避障，而无需使环境适应机器人的感官能力。为了进一步提高鲁棒性，我们在各种困难的环境中进行训练，并同时运行32个训练实例

2022-01-30 09:05:32 107.93MB 自主机器人

基于间隙的强化学习无监督探索_Gap-Dependent Unsupervised Exploration for Reinfo

基于间隙的强化学习无监督探索_Gap-Dependent Unsupervised Exploration for Reinforcement Learning.pdf

2022-01-30 09:03:52 821KB cs

百度开源的深度强化学习框架PARL源代码

ARL 框架的名字来源于 PAddlepaddle Reinfocement Learning，是一款基于百度 PaddlePaddle 打造的深度强化学习框架。PARL 与现有强化学习工具和平台相比，具有更高的可扩展性、可复现性和可复用性，支持大规模并行和稀疏特征，能够快速对工业级应用案例的验证。这个在 github 上是开源的，但是鉴于有些朋友工具受限下载很慢，所以特地搬运过来！

2022-01-26 13:53:22 24.68MB 强化学习 深度学习框架 PARL 强化学习框架

1

《深入浅出机器学习》之强化学习

本文来自于简书，本文章主要通过举例来论证机器学习算法，通过矩阵进行强化学习介绍。所谓强化学习就是智能系统从环境到行为映射的学习，以使奖励信号(强化信号)函数值最大。如果Agent的某个行为策略导致环境正的奖赏(强化信号)，那么Agent以后产生这个行为策略的趋势便会加强 -《百科》

2022-01-25 22:40:01 507KB 《深入浅出机器学习》之强化学习

1

eventwuzhishuinterval_触发控制_事件触发控制_最优控制_事件触发控制_事件触发

事件触发相关程序，最优控制相关内容，可运行

2022-01-23 21:39:20 14KB 触发控制 事件触发控制 最优控制 事件触发控制

1

保守离线分布强化学习_Conservative Offline Distributional Reinforcement Lea

保守离线分布强化学习_Conservative Offline Distributional Reinforcement Learning.pdf

2022-01-22 09:02:11 1.46MB cs

保护决策的深层强化学习_Deep Reinforcement Learning for Conservation Decisio

保护决策的深层强化学习_Deep Reinforcement Learning for Conservation Decisions.pdf

2022-01-22 09:02:10 518KB cs

一种改进阈值函数的小波语音去噪方法

一种改进阈值函数的小波语音去噪方法一种改进阈值函数的小波语音去噪方法

2022-01-22 00:35:16 99KB 语音压缩

1

用基于策略梯度得强化学习方法训练AI玩王者荣耀

2022-01-21 15:15:00 40KB 人工智能

1

个人信息

热门下载

最新下载

其他资源