这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手) ◉ 简介:这是本书的第二版,旨在为所有相关学科的读者提供一个清晰的、简单的强化学习关键思想&算法的说明。书籍在第一版的基础上,增加了近些年新的研究主题,内容重点放在核心的算法上。 ◉ 目录: 介绍 多臂老虎机 有限马尔可夫决策过程 动态规划 蒙特卡罗方法 时差学习 n-step Bootstrapping 使用表格方法进行规划和学习 带近似的策略预测 带近似的策略控制 带近似的离策略方法 资格痕迹 策略梯度方法 心理学 神经科学 应用与案例研究 前沿
2022-12-29 20:28:28 8.21MB 人工智能 强化学习 算法 动态规划
1
这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手) ◉ 简介:这是新书『强化学习的数学基础』的书稿,作者赵世钰,现任西湖大学工学院智能无人系统实验室主任。2022年秋季是作者第四次教授强化学习的研究生课程,撰写这份资料是为了弥补已有教材的不足。 ◉ 目录: 第2章:贝尔曼方程,是分析状态值的基本工具 第3章:贝尔曼最优方程,是一个特殊的贝尔曼方程 第4章:值迭代算法,是一种求解贝尔曼最优方程的算法 第5章:蒙特卡罗学习,是第4章策略迭代算法的扩展 第6章:随机逼近的基础知识 第7章:时差学习,第6章是本章的基础 第8章:扩展了表格时间对价值函数逼近情况的差分学习方法 第9章:策略迭代 第10章:actor-critic 方法
2022-12-29 20:28:27 1.68MB 人工智能 强化学习 机器学习 数学
1
这是 ShowMeAI 持续分享的速查表系列!本系列速查表包含 200 多张知识卡片,分为『计算机科学』『机器学习』『计算机视觉和深度学习基础』『计算机视觉和深度学习精选专题』4个主题,用以回顾多年的 ML 研究、课程和学习中的所有内容,并为机器学习工程师的面试做准备。 这个文件是『计算机视觉和深度学习基础』主题(其他部分的下载链接见评论区),包含以下部分: Low Level / Classical Techniques in Vision And Image Processing(视觉和图像处理中的低层次/经典技术) Deep Learning Fundamentals(深度学习基础) Seminal & Foundational Topics in Deep Learning(深度学习中的标志性和基础性课题) Neural Networks Designed for Sequential Data (为序列数据设计的神经网络 Transfer Learning(迁移学习) Unsupervised & Self-Supervised Learning(无监督和自我监督的学习)
1
这是 ShowMeAI 持续分享的速查表系列!本系列速查表包含 200 多张知识卡片,分为『计算机科学』『机器学习』『计算机视觉和深度学习基础』『计算机视觉和深度学习精选专题』4个主题,用以回顾多年的 ML 研究、课程和学习中的所有内容,并为机器学习工程师的面试做准备。 这个文件是『计算机科学』主题(其他部分的下载链接见评论区),包含以下部分: PL Fundamentals(PL基础知识) Data Structures & Algorithms(数据结构和算法) Bit Manipulations(位操作) Time/Space Complexity(时间/空间复杂度)
1
这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手) ◉ 简介:《The Design of Approximation Algorithms》整理自哥本哈根大学同名课程的教学资料。书籍围绕近似算法的几个核心算法技术展开,包括贪婪和局部搜索算法、动态编程、线性和半无限编程以及随机化。资料第一部分的每一章都专门讨论一种算法技术,然后将其应用于几个不同的问题。第二部分重温了这些技术,但对它们进行了更复杂的处理。 ◉ 目录: 贪婪算法和局部搜索 舍入数据和动态编程 线性程序和确定性舍入 线性程序的随机抽样和随机舍入 半定约程序的随机舍入 原始二元法 多路切割问题 随机抽样、优先抽样 心数估计 多数据集的总结 有序数据的总结 乘法权重 在线算法
2022-12-29 18:25:28 2.3MB 人工智能 算法 机器学习 深度学习
1
基于目标检测的户型图识别方法、装置、计算机设备.docx基于目标检测的户型图识别方法、装置、计算机设备.docx基于目标检测的户型图识别方法、装置、计算机设备.docx基于目标检测的户型图识别方法、装置、计算机设备.docx基于目标检测的户型图识别方法、装置、计算机设备.docx基于目标检测的户型图识别方法、装置、计算机设备.docx基于目标检测的户型图识别方法、装置、计算机设备.docx基于目标检测的户型图识别方法、装置、计算机设备.docx
K210字母识别模型及代码,可以同时识别多个字母,适用于micpy产品 部署平台nncase 模型网络transfer_learning 主干网络mobilenet_0.75 训练次数100 批量大小32 学习率0.001 标注框限制10 训练集:558 验证集:62
2022-12-29 11:28:37 1.63MB 人工智能 cv
1
FANUC机器人培训教程资料文档--00_上海发那科机器人有限公司介绍,初步介绍了工业机器人的应用领域及其广泛定义,适用于零基础初学者入门
2022-12-29 11:28:17 6.01MB 工业机器人 人工智能 自动化
1
大牛的讲义
2022-12-29 11:28:12 4.18MB 人工智能
1