癌症是一种复杂的疾病,通过增加收集的数据量和部署的计算能力来帮助人们理解和治疗癌症。因此,越来越需要开发数据驱动的深度学习方法,尤其是用于癌症诊断、检测、预后和预测等各种任务的深度学习方法。然而,尽管最近取得了成功,但为非图像和非文本癌症数据设计高性能的深度学习模型是一项耗时、反复尝试的手动任务,需要癌症领域和深度学习专业知识。为此,我们开发了一种基于强化学习的神经架构搜索,以自动匹配基于深度学习的预测模型开发,用于一类具有代表性的癌症数据。我们开发定制的构建块,允许领域专家结合癌症数据的特定特征。我们表明,我们的方法发现了深度神经网络结构,其可训练参数明显较少,训练时间较短,精确度与手动设计的结构相似或更高。我们在Argonne Leader  ship Computing Facility的Theta超级计算机的多达1024个Intel Knights着陆节点上研究并演示了我们方法的可扩展性。我们开发了可扩展的基于RL的NAS,以自动化一类癌症数据的DNN模型开发。我们设计了一个NAS搜索空间,该空间考虑了特定于非图像和非文本癌症数据的特征。我们在多达1024个Intel Kni
2022-02-01 18:02:38 1.87MB 深度学习 架构 dnn 自动化
-深度强化学习已成功应用于各种电脑游戏[8]。然而,它在实际应用中仍然很少使用,尤其是在实际移动机器人的导航和连续控制中[13]。以前的方法缺乏安全性和鲁棒性,并且/或者需要一个结构化的环境。在本文中,我们提出了一种在未知环境下,无地图或规划器的真实机器人自主自学习导航的概念证明。机器人的输入仅仅是来自2D激光扫描仪和RGB-D相机的融合数据,以及目标的方向。环境地图是未知的。异步网络(GA3C)的输出动作是机器人的线性速度和角速度。 导航/控制器网络在一个高速、并行、自实现的仿真环境中进行预训练,以加快学习过程,然后部署到实际机器人上。为了避免过度拟合,我们训练相对较小的网络,并向输入激光数据中添加随机高斯噪声。传感器数据与RGB-D摄像头的融合使机器人能够在真实环境中进行导航,实现真正的3D避障,而无需使环境适应机器人的感官能力。 为了进一步提高鲁棒性,我们在各种困难的环境中进行训练,并同时运行32个训练实例
2022-01-30 09:05:32 107.93MB 自主机器人
基于间隙的强化学习无监督探索_Gap-Dependent Unsupervised Exploration for Reinforcement Learning.pdf
2022-01-30 09:03:52 821KB cs
ARL 框架的名字来源于 PAddlepaddle Reinfocement Learning,是一款基于百度 PaddlePaddle 打造的深度强化学习框架。PARL 与现有强化学习工具和平台相比,具有更高的可扩展性、可复现性和可复用性,支持大规模并行和稀疏特征,能够快速 对工业级应用案例的验证。 这个在 github 上是开源的,但是鉴于有些朋友工具受限下载很慢,所以特地搬运过来!
1
本文来自于简书,本文章主要通过举例来论证机器学习算法,通过矩阵进行强化学习介绍。所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。如果Agent的某个行为策略导致环境正的奖赏(强化信号),那么Agent以后产生这个行为策略的趋势便会加强 -《百科》
1
保守离线分布强化学习_Conservative Offline Distributional Reinforcement Learning.pdf
2022-01-22 09:02:11 1.46MB cs
保护决策的深层强化学习_Deep Reinforcement Learning for Conservation Decisions.pdf
2022-01-22 09:02:10 518KB cs
一种改进阈值函数的小波语音去噪方法一种改进阈值函数的小波语音去噪方法
2022-01-22 00:35:16 99KB 语音压缩
1
用基于策略梯度得强化学习方法训练AI玩王者荣耀
2022-01-21 15:15:00 40KB 人工智能
1