流行的无模型强化学习算法 PyTorch和Tensorflow 2.0在Openai体育馆环境和自行实现的Reacher环境中均实现了最新的无模型强化学习算法。 算法包括软参与者关键(SAC),深度确定性策略梯度(DDPG),双延迟DDPG(TD3),参与者关键(AC / A2C),近端策略优化(PPO),QT-Opt(包括交叉熵( CE)方法) , PointNet ,运输商,循环策略梯度,软决策树等。 请注意,此存储库更多是我在研究和实施期间实施和测试的个人算法集合,而不是正式的开放源代码库/软件包以供使用。 但是,我认为与他人分享它可能会有所帮助,并且我希望对实现进行有益的讨论。 但是我没有花太多时间在清理或构建代码上。 您可能会注意到,每种算法可能都有几种实现方式,在此我特意展示所有这些方式,供您参考和比较。 此外,此存储库仅包含PyTorch实施。 对于RL算法的官方库,
1
在动态图像文件行为的分布式图像可视化中,使用GAN模拟恶意软件作者以提供主动保护 引用为: VS Bhaskara, and D. Bhattacharyya. arXiv preprint arXiv:1807.07525 [stat.ML] (2018) 。 引用代码 训练的WGAN-GP模型基于上发布的代码。 我们将带有improved_wgan_training/gan_64x64.py脚本与GoodGenerator和GoodDiscriminator函数定义的网络体系结构GoodDiscriminator使用。 每个通道使用的64位dHash基于上的实现。 在color_dHash192.py脚本中显示了通过在彩色图像的通道上串联dHash来哈希的扩展。 数据集 dataset_filedetails.csv :列出文件SHA256哈希值和所使用的12,006个不同可执行文
2023-03-09 20:35:43 4.94MB security machine-learning deep-learning Python
1
sklearn-cookbook-zh:[翻译] Scikit-learn秘籍
2023-03-08 17:30:47 1.53MB python machine-learning book scikit-learn
1
Big5-性格React烧瓶 这是一个项目,我们可以在该项目上构建一个React应用并调用端点进行预测。 使用的模型是随机森林回归器和随机森林分类器。 使用myPersonality项目( )的数据集对模型进行训练。 模型使用回归模型生成预测的人格得分,并使用分类模型针对每个人格特征生成二元类别的概率。 技术领域 后端烧瓶 前端React 修改后的准备 Create-react-app创建一个基本的React应用程序。 接下来,加载了引导程序,该引导程序使我们可以为每个屏幕尺寸创建响应式网站。 在App.js文件中,添加了带有textarea和Predict按钮的表单。 将每个表单属性添加到状态,并在按下Predict按钮时,将数据发送到Flask后端。 将样式添加到页面的App.css文件。 Flask应用程序具有POST终结点/预测。 它接受输入值作为json,将其转换为数组,并使
2023-03-08 15:34:48 116.93MB deep-learning reactjs word word-embeddings
1
道路分割 客观的 在自动驾驶的情况下,给定前摄像头视图,汽车需要知道道路在哪里。 在这个项目中,我们训练了神经网络,通过使用一种称为完全卷积网络(FCN)的方法来标记图像中道路的像素。 在此项目中,使用KITTI数据集实施FCN-VGG16并对其进行了培训,以进行道路分割。 演示版 (单击以查看完整的视频) 1代码和文件 1.1我的项目包括以下文件和文件夹 是演示的主要代码 包含单元测试 包含一些帮助程序功能 是带有GPU和Python3.5的环境文件 文件夹包含KITTI道路数据,VGG模型和源图像。 文件夹用于保存训练后的模型 文件夹包含测试数据的细分示例 1.2依赖关系和我的环境 Miniconda用于管理我的。 Python3.5,tensorflow-gpu,CUDA8,Numpy,SciPy 操作系统:Ubuntu 16.04 CPU:Intel:registered:Core:trade_mark:i7-68
1
deep learning with pytorch英问书籍,入门pytorch必备书籍。。
2023-03-06 22:35:12 7.29MB deep learnin
1
Pytorch 官方书籍英文版配套代码
2023-03-06 22:16:53 169.37MB pytorch 代码 书籍
1
SimCLR-视觉表示形式对比学习的简单框架 消息! 我们发布了SimCLR的TF2实现(以及TF2中的转换后的检查点),它们位于。 消息! 新增了用于Colabs,请参见。 SimCLR的插图(来自 )。 SimCLRv2的预训练模型 我们在这里开源了总共65个经过预训练的模型,与论文的表1中的模型相对应: 深度 宽度 SK 参数(M) 金融时报(1%) FT(10%) FT(100%) 线性评估 监督下 50 1倍 错误的 24 57.9 68.4 76.3 71.7 76.6 50 1倍 真的 35 64.5 72.1 78.7 74.6 78.5 50 2倍 错误的 94 66.3 73.9 79.1 75.6 77.8 50 2倍 真的 140 70.6 77.0 81.3 77.7 79.3 101 1
1
轻型GBM 高性能渐变增强-适用于Ruby 安装 将此行添加到您的应用程序的Gemfile中: gem 'lightgbm' 在Mac上,还要安装OpenMP: brew install libomp 培训API 准备数据 x = [ [ 1 , 2 ] , [ 3 , 4 ] , [ 5 , 6 ] , [ 7 , 8 ] ] y = [ 1 , 2 , 3 , 4 ] 训练模型 params = { objective : "regression" } train_set = LightGBM :: Dataset . new ( x , label : y ) booster = LightGBM . train ( params , train_set ) 预测 booster . predict ( x ) 将模型保存到文件 booster . save_mode
2023-03-06 19:44:59 62KB machine-learning lightgbm rubyml Ruby
1
菌素 phygnn (fi-geon | ˈfi-jən)名词。 物理学指导的神经网络 一只稀有的神话鸟 物理学指导的神经网络的这种实现通过通用的损失项增强了传统的神经网络损失功能,该损失项可用于指导神经网络学习物理或理论约束。 phygnn使科学软件开发人员和数据科学家能够轻松地将机器学习模型集成到物理和工程应用程序中。当将纯数据驱动的机器学习模型应用于科学应用时,例如当机器学习模型产生物理上不一致的结果或难以推广到样本外场景时,此框架应有助于缓解一些经常遇到的挑战。 有关phygnn类框架的详细信息,请参见 例如,使用phygnn架构进行回归,分类甚至GAN应用,请参见 在国家可再生能源实验室(NREL),我们使用phygnn框架来补充传统的基于卫星的云属性预测模型。当传统的机械模型失效时,我们使用phygnn预测云的光学特性,并使用基于张量的完整辐射传递模型作为物理损耗函数,将预测
2023-03-06 11:07:31 7.89MB machine-learning neural-networks Python
1