深度强化学习指南(与Keras和OpenAi体育馆一起使用) 使用Keras和OpenAi体育馆进行深度强化学习策略梯度方法的分步教程。 在这个简短的项目中,我们将使用强化学习算法(策略梯度方法-REINFORCE)训练神经网络玩Pong游戏。 如果要运行它,则只需克隆存储库,然后打开钢筋_learning_pong_keras_policy_gradients.ipynb ,然后阅读并运行笔记本 我们训练了一个简单的200个隐藏的神经元网络和一个卷积模型。 简单网络的示例播放: 简单网络玩游戏的视频( ): 卷积网络玩游戏的视频( ): 考虑到有限的时间和出于学习目的,我并不是要寻找一个受过良好训练的代理,但我希望这个项目可以帮助人们熟悉rl算法和keras的基本过程。 上面的视频花了3天时间让代理在慢速的计算机上学习。 为了获得生产结果,需要更多的培训和调整,这不是我
2021-12-12 21:46:08 9.8MB tutorial reinforcement-learning ai guide
1
随机梯度下降的稳定性和最优性 这是正在进行的论文的方法和算法的随附代码实现。 维护者 Dustin Tran < > 参考 弗朗西斯·巴赫 (Francis Bach) 和埃里克·穆林 (Eric Moulines)。 收敛速度为 O(1/n) 的非强凸平滑随机近似。 神经信息处理系统的进展,2013 年。 杰罗姆·弗里德曼、特雷弗·哈斯蒂和罗伯特·蒂布希拉尼。 通过坐标下降的广义线性模型的正则化路径。 统计软件杂志,33(1):1-22, 2010。 瑞·约翰逊和张彤。 使用预测方差减少加速随机梯度下降。 神经信息处理系统的进展,2013 年。 大卫·鲁珀特。 来自缓慢收敛的 robbins-monro 过程的有效估计。 技术报告,康奈尔大学运筹学和工业工程,1988 年。 魏旭。 使用平均随机梯度下降实现最优的一次通过大规模学习。 arXiv 预印本 , 2011。
2021-12-11 18:47:04 34KB R
1
纹理特征提取技术,包括灰度共生矩阵,灰度梯度矩阵,用于图像的分类识别
2021-12-11 16:49:59 11KB 共生矩阵
1
SVM编程(内含数据集) 您需要使用课程中介绍的随机梯度下降法来实现一个版本的软边距支持向量机。您将在给定的数据集(从课程网站下载)上运行代码,然后对测试数据集进行预测。衡量你得分的标准是你在测试数据集上的准确性。(提示:由于测试数据集中没有给定的标签,因此需要从训练集中创建验证数据集以优化参数)。
2021-12-10 17:18:12 514KB SVM 大数据 机器学习 随机梯度下降法
1
交叉差分法(Robert梯度)
2021-12-09 23:41:53 3.16MB 数字图像
1
GVF snake的C++实现,开发环境为VC6.0,OpenCV。大部分代码都为本地代码。代码依据GVF原始论文以及其demo编写。
2021-12-09 16:19:31 89KB snake GVF 活动轮廓模型 梯度向量场
1
计算球体重力及重力梯度异常,已知地下球体的相关参数,即可正演该球体的重力及重力梯度
建立稳态传热反问题中边界条件多宗量反演的求解模式,导出了敏度计算公式,应用改进的共轭梯度技术进行求解,探讨了测点配置和测量误差对反演结果的影响.数值计算给出了令人满意的结果.
2021-12-08 20:24:25 224KB 自然科学 论文
1
梯度提升决策树算法(GBDT)作者:江尘([受电子邮件保护])GBDT是Jerome H. Friedman的梯度提升决策树算法的高性能且功能齐全的C ++实现。 ([受电子邮件保护])GBDT是Jerome H. Friedman的“梯度增强决策树算法”及其现代后代的高性能且功能齐全的C ++实现。 它具有高效,低内存占用,丢失功能的集合以及内置机制来处理分类功能和缺失值的功能。 GBDT什么时候对您有利? 您正在寻找的不仅仅是线性模型。 梯度提升决策
2021-12-08 12:37:00 7.87MB C/C++ Miscellaneous
1
HOG(方向梯度直方图)代码实现以及流程图.rar
2021-12-08 09:01:02 953KB 图像处理
1