火炬RL RL方法的Pytorch实现 支持具有连续和离散动作空间的环境。 支持具有1d和3d观察空间的环境。 支持多进程环境 要求 一般要求 火炬1.7 健身房(0.10.9) Mujoco(1.50.1) 列表(用于日志) tensorboardX(日志文件输出) 张量板要求 Tensorflow:启动tensorboard或读取tf记录中的日志 安装 使用use environment.yml创建虚拟环境 conda create -f environment.yml source activate py_off 手动安装所有要求 用法 在配置文件中指定算法的参数,并在参数中指定日志目录/种子/设备 python examples/ppo_continuous_vec.py --config config/ppo_halfcheetah.json --seed 0 --device 0 --id ppo_halfcheetah 结帐示例文件夹以获取详细信息 目前包含: 政策上的方法: 加强 A2C(演员评论家) PPO(近端政策优化)
2021-11-23 11:43:20 170KB algorithm reinforcement-learning pytorch dqn
1
本人第一次写博客,写这篇博客主要是以前没有接触过matlab这个软件,刚好这段时间在学习流形学习算法,接触到LLE算法的时候,就想到在网上下载了代码,直接就试着在matlab中跑了一下,结果很悲剧。毕竟不完整的嘛,没有赋值这些情况,所以在网上参考了一个带有实例的源程序(以瑞士卷为例),奈何是新手,只有对着代码挨个挨个的查找注释。故上传上来分享一下给和我差不多一样的小白解惑。
2021-11-22 21:19:15 2KB matlab LLE
1
置信区间 通常描述某估计的不确定性的方法是使用置信区间,真实的值以一定的概率落入该区间中,这样的估计称为置信区间估计 定义:某个参数p的N%置信区间是一个以N%的概率包含p的区间 由于估计量errorS(h)服从二项分布,这一分布的均值为errorD(h),标准差可由式5.9计算,因此,为计算95%置信区间,只需要找到一个以errorD(h)为中心的区间,它的宽度足以包含该分布全部概率的95% 这提供了一个包围errorD(h)的区间,使errorS(h)有95%机会落入其中,同样它也指定了errorD(h)有95%的机会落入包围errorS(h)的区间的大小
2021-11-22 12:47:44 7.1MB 机器学习 算法汇总
1
内容包括朴素贝叶斯算法python实现代码,实现对iris分类,包含iris的txt格式的数据集。
1
字符识别:使用机器学习算法(SVM,KNN)从图像中识别字符
2021-11-21 14:02:23 30.79MB python opencv machine-learning scikit-learn
1
李航老师的《统计学习方法》书里第二章感知机学习算法的原始形式的matlab程序
2021-11-19 20:12:07 676B 感知机算法
1
本专栏是书《深度学习入门》的阅读笔记一共八章: 第一章深度学习中的Python基础。主要讲解了深度学习将要用到的python的基础知识以及简单介绍了numpy库和matpoltlib库,本书编写深度学习神经网络代码仅使用Python和numpy库,不使用目前流行的各种深度学习框架,适合入门新手学习理论知识。 第二章感知机。主要介绍了神经网络和深度学习的基本单元感知机。感知机接收多个输入,产生一个输出,单层感知器可以实现与门,或门以及与非门,但是不能实现异或门,异或门的实现需要借助多层感知机,这也就是说,单层感知机只能表示线性空间,而非线性空间的表示需要借助多层感知机。 第三章神经网络——基于n
2021-11-19 15:19:07 94KB mp num numpy
1
针对传统的机器学习算法对不平衡数据集的少类分类准确率不高的问题,基于支持向量机和模糊聚类,提出一种不平衡数据加权集成学习算法。首先提出加权支持向量机模型(Weighted Support Vector Machine,WSVM),该模型根据不同类别数据所占比例的不同,为各类别分配不同的权重,然后将WSVM与模糊聚类结合提出一种新的集成学习算法。将本文提出的算法应用于人造数据集和UCI数据集实验中,实验结果表明,所提出的算法能够有效地解决不平衡数据的分类问题,具有更好的分类性能。
2021-11-18 16:49:16 1.07MB 不平衡数据集
1
论文 有关用机器学习算法进行恶意代码检测。分别针对静态、动态这 2 种分析 模式下的检测方案进行了讨论,涵盖了恶意代码样本采集、特征提取与选择、机器学习算法分类模型的建立等要点。对机器学习算法下恶意代码检测的未来工作与挑战进行了梳理。为下一代恶意代码检测技术的设计 和优化提供了重要的参考
2021-11-17 21:10:47 2.39MB 恶意代码 机器学习
1
该附件提供了机器学习中的一些经典算法,包括分类、聚类、关联规则挖掘等。使用python实现,对初学者比较有用。
2021-11-16 21:11:16 7.44MB 人工智能 机器学习 python
1