The topic of this book is Reinforcement Learning—which is a subfield of Machine Learning—focusing on the general and challenging problem of learning optimal behavior in complex environment. The learning process is driven only by reward value and observations obtained from the environment. This model is very general and can be applied to many practical situations from playing games to optimizing complex manufacture processes. Due to flexibility and generality, the field of Reinforcement Learning is developing very quickly and attracts lots of attention both from researchers trying to improve existing or create new methods, as well as from practitioners interested in solving their problems in the most efficient way. This book was written as an attempt to fill the obvious lack of practical and structured information about Reinforcement Learning methods and approaches. On one hand, there are lots of research activity all around the world, new research papers are being published almost every day, and a large portion of Deep Learning conferences such as NIPS or ICLR is dedicated to RL methods. There are several large research groups focusing on RL methods application in Robotics, Medicine, multi-agent systems, and others. The information about the recent research is widely available, but is too specialized and abstract to be understandable without serious efforts. Even worse is the situation with the practical aspect of RL application, as it is not always obvious how to make a step from the abstract method described in the mathematical-heavy form in a research paper to a working implementation solving actual problem. This makes it hard for somebody interested in the field to get an intuitive understanding of methods and ideas behind papers and conference talks. There are some very good blog posts about various RL aspects illustrated with working examples,
2025-09-14 16:07:20 22.48MB 深度学习
1
深度强化学习上手实战,必备书籍。 The topic of this book is Reinforcement Learning—which is a subfield of Machine Learning—focusing on the general and challenging problem of learning optimal behavior in complex environment. The learning process is driven only by reward value and observations obtained from the environment. This model is very general and can be applied to many practical situations from playing games to optimizing complex manufacture processes.
2025-09-14 16:06:16 28.16MB 深度学习 强化学习
1
EPUB格式,包含配套代码。压缩包里还包括Fluent Python,PDF和EPUB格式;Python Master the Art of Design Patterns,PDF格式。 What you will learn Understand the basics of RL methods, algorithms, and elements Train an agent to walk using OpenAI Gym and Tensorflow Understand Markov decision process, Bellman's optimality, and temporal difference (TD) learning Solve multi-armed bandit problems using various algorithms Master deep learning algorithms, such as RNN, LSTM, and CNN with applications Build intelligent agents using the DRQN algorithm to play the Doom game Teach agents to play the Lunar Lander game using DDPG Train an agent to win a car racing game using dueling DQN
2025-09-14 15:48:46 129.58MB tensorflow python
1
Hands-On Reinforcement Learning with Python》是一本深入实践的书籍,旨在帮助读者理解并掌握强化学习的基本概念和算法,同时通过Python编程实现这些算法。强化学习是机器学习的一个重要分支,它通过与环境的交互来学习最优策略,以最大化长期奖励。这本书适合有一定Python基础和机器学习知识的读者,它将理论与实践相结合,使得学习过程更为直观和生动。 本书首先会介绍强化学习的基础知识,包括马尔科夫决策过程(Markov Decision Process, MDP)、动态规划(Dynamic Programming)、Q学习、SARSA等基础算法。MDP是强化学习的核心模型,它描述了一个状态转移过程,其中未来的状态只依赖于当前状态和采取的行动。动态规划是解决MDP的一种方法,包括价值迭代和策略迭代,它们提供了理论上最优的解决方案。 Q学习是无模型强化学习中最常见的算法之一,它通过更新Q表来近似最优策略。SARSA(State-Action-Reward-State-Action)则是一种在线学习算法,它在每次动作之后立即更新策略,使得学习过程更加实时。这两种算法都使用了Bellman方程,这是强化学习理论中的关键工具。 接着,书会涉及深度强化学习(Deep Reinforcement Learning, DQN)的内容,这是近年来强化学习领域的热点。DQN利用深度神经网络作为函数近似器,解决了传统Q学习中Q表维度过高无法扩展的问题。书中可能会涵盖Double DQN、 Dueling DQN 和 Prioritized Experience Replay 等改进策略,这些策略提高了DQN的稳定性和性能。 此外,还可能讲解到Policy Gradient 方法,如REINFORCE算法,以及Actor-Critic方法,这些方法直接优化策略函数而不是价值函数。在更复杂的环境中,如Atari游戏或机器人控制任务中,这些方法表现出色。 书中还会涵盖近似动态规划的方法,如TD学习(Temporal Difference Learning),以及蒙特卡洛方法,它们在实际应用中有着广泛的应用。可能会讨论到多智能体强化学习(Multi-Agent Reinforcement Learning)和连续动作空间的强化学习问题,这些都是强化学习在复杂系统和现实世界问题中的挑战。 通过阅读《Hands-On Reinforcement Learning with Python》,读者不仅能理解强化学习的基本原理,还能通过实际的Python代码加深理解,从而具备独立实现和应用强化学习算法的能力。这本书的实践性使得读者能够快速地将所学应用到实际项目中,提升自己的技能水平。
2025-09-14 15:43:05 14.69MB deep learnin
1
大型语言模型是一类通过深度学习技术训练得到的能够处理自然语言任务的复杂神经网络模型。这些模型能够理解、生成或转换自然语言文本,为各种应用提供了强大的支持。Jay Alammar和Maarten Grootendorst在他们的著作《动手学大语言模型》中,提供了对这一领域深入浅出的介绍和实践指南。这本书对于行业内的实际应用有着非常重要的指导意义,书中采用了高度视觉化的介绍方式,覆盖了语言模型在生成、表示和检索等应用方面,这使得读者能够迅速地理解和掌握这些模型的使用与优化。 本书得到业界的广泛赞誉。例如,Nils Reimers(Cohere机器学习总监兼sentence-transformers的创造者)认为这本书是理解语言模型实用技术的一个宝贵资源。Andrew Ng(深度学习AI的创始人)也对此书给予了高度评价,认为它包含着插图和代码等元素,使得复杂主题变得易于理解。Josh Starmer(StatQuest的创始人)表示,在这本书的每一页上,他都能学到在当前语言模型时代取得成功所必需的知识。Luis Serrano(Serrano Academy的创始人兼CEO)则强调了这本书在算法进化、理论严格性和实用指导方面的结合,使之成为对任何对生成式人工智能感兴趣的读者来说必不可少的读物。 《动手学大语言模型》不仅提供了深入浅出的理论知识,还通过丰富的实例和全面的代码实验室,带领读者深入了解转换器模型、标记器、语义搜索、RAG等尖端技术的工作原理。读者通过阅读这本书,将能够从语言模型的历史和最新进展中迅速成长,成为一名专家。此外,书中内容涵盖了文本和视觉嵌入的融合,这为想要提升在生成式AI领域的知识水平的读者提供了丰富的案例研究和解决方案。 本书强调了大型语言模型的实践应用和重要性,随着人工智能技术的快速发展,掌握这些知识变得日益重要。无论读者是学生、研究者还是行业专业人士,这本书都能为其提供所需的实用知识和使用案例,帮助他们更有效地使用和提升对生成式AI的理解。
2025-08-29 09:59:27 21.37MB Large Language Models Transformers
1
带有Eclipse MicroProfile的动手企业Java微服务 这是Packt发布的的代码存储库。 使用Java构建和优化您的微服务架构 这本书是关于什么的? Eclipse MicroProfile作为多供应商,可互操作的,社区驱动的规范,在行业中获得了动力。 它是一个主要的破坏者,它使在企业Java上进行了大量投资的组织可以在无需花费大量培训劳动力的情况下转向微服务。 本书涵盖以下激动人心的功能: 了解微服务为什么在数字经济中很重要 分析MicroProfile如何满足企业Java微服务的需求 使用Eclipse MicroProfile测试和保护您的应用程序 掌握各种MicroProfile功能,例如OpenAPI和Typesafe REST Client 探索MicroProfile Stream和Messaging候选API的React式编程 使用MicroPr
2025-08-28 14:04:26 4.13MB Java
1
The mission of the book is to make you familiar with the tools that you can use to develop and deploy Java EE applications in the cloud. You will be led through the whole application development process: creating the application, deploying in the cloud, configuring Continuous Integration, and secure and fault-tolerant communication between the created services. As a result, you will gain practical knowledge of Java EE cloud development, which you can use as a reference for your further projects.
2025-07-09 14:20:11 7.35MB WildFly Swarm OpenShift Java
1
在当前信息科技快速发展的时代,人工智能已经成为引领科技进步的重要力量。其中,大型语言模型(LLM)作为人工智能领域的一项关键技术,近年来受到了广泛关注和研究。LLM凭借其在自然语言处理方面出色的表现,已经成为学术界和工业界研究的热点。此次分享的四本图书,从不同的角度深入探讨了大型语言模型的构建、应用和工程实践。 《Building An LLM from scratch》(从零开始构建LLM)一书提供了对LLM构建过程的全面解析,从基础理论到实践操作,指导读者如何从零开始搭建自己的大型语言模型。本书不仅覆盖了算法选择、模型训练、优化策略等技术细节,还包含了对大规模数据处理、计算资源管理等挑战的深入分析。对于那些希望从基础学起,深入了解大型语言模型原理和技术实现的读者而言,这本图书将是绝佳的入门教材。 紧随其后的是《Hands-on LLMs》(动手实践LLM),这本书更注重于LLM的实际应用。它不仅阐述了在构建和训练大型语言模型时遇到的各种问题,还提供了大量案例研究和实战指南,让读者能够直接参与到模型的实际应用中。该书适合那些已有一定理论基础,但想要将这些理论应用到实际问题中去的读者。 《AI Engineering》(人工智能工程)一书,则从工程的角度出发,探讨了如何将人工智能技术规模化、产品化。其中涵盖了人工智能系统设计、模型评估、系统部署、运维监控等多方面的内容。该书强调了在设计、开发和维护大型语言模型时,工程师需要考虑的诸多工程问题,包括但不限于系统架构设计、数据处理流程、自动化测试等,是那些准备从事AI工程化工作的读者的必读书籍。 作为一本工具书,《LLM Engineer’s Handbook》(LLM工程师手册)为从事大型语言模型工作的工程师们提供了实用的参考资料。书中详细介绍了工程师在开发和维护大型语言模型过程中可能遇到的各种问题及其解决方案,旨在成为工程师日常工作中的实用手册。无论是初入行业的工程师,还是资深的AI专家,这本书都能提供丰富的知识和灵感。 综合上述,这四本图书是全面了解和掌握大型语言模型构建与应用知识的宝贵资源。它们为读者提供了从理论到实践,再到工程实现的全方位视角,使得无论是学术研究者还是工业界的技术人员,都能够从中学到构建和优化大型语言模型所需的关键知识。对于正在寻求在这领域内精进技艺的专业人士,这些书籍无疑是最佳的参考资料。
2025-07-01 13:59:20 74.79MB
1
在本动手实验中,我们将深入探索Azure Data Factory(ADF),这是一个云原生的数据集成服务,用于创建、调度和管理ETL(提取、转换、加载)和ELT(提取、加载、转换)工作流。ADF提供了丰富的功能,如数据复制、数据转换、数据触发以及与其他Azure服务的深度集成,是构建现代化数据仓库和数据湖解决方案的关键组件。 **Azure Data Factory基础知识** Azure Data Factory 是微软云中的一个完全托管的服务,允许用户通过图形化界面或JSON脚本来创建数据集成工作流。它支持多种数据源,包括Azure内的存储服务(如Blob Storage、ADLS Gen2)以及SQL Server、Oracle、SAP等外部数据源。 **ADF管道与活动** 在ADF中,数据集成逻辑被组织成"管道",每个管道可以包含一个或多个"活动"。活动是执行特定任务的单元,如数据复制、数据转换或控制流操作。例如,"Filter Activity"根据指定条件筛选数据,"Lookup Activity"用于从另一个数据源查询数据,"ForEach Activity"则用于对集合执行迭代操作,而"Metadata Activity"用于获取数据集的元数据。 **映射数据流** ADF的一项强大特性是"Mapping Data Flows",它提供了一种可视化方式来设计和执行数据转换。数据流允许非编码人员也能进行复杂的数据转换,如选择、重命名、过滤、聚合、合并和JOIN等操作。此外,它还支持Spark引擎进行大规模并行处理,提高了处理大量数据的效率。 **Azure Key Vault集成** 在安全性和合规性方面,ADF能够与Azure Key Vault集成,用于管理连接字符串、凭据和其他敏感信息。这样可以确保数据访问的安全,并符合企业安全标准。 **ETL/ELT流程** ADF支持两种主要的数据集成模式:ETL(提取、转换、加载)和ELT(提取、加载、转换)。ETL模式在云中完成数据转换,而ELT模式则将数据加载到云存储后,再在计算层如Azure Databricks或HDInsight上执行转换。 **Web Activity** Web Activity允许在ADF管道中执行HTTP请求,这可以用于调用REST API、触发Web服务或者获取外部系统的状态信息。这对于集成各种云服务和实现自动化工作流程非常有用。 **Azure Modern Data Warehouse** ADF在构建现代化数据仓库中扮演着重要角色,它可以轻松地将数据从多个来源整合到Azure SQL Data Warehouse、Synapse Analytics或大数据平台(如ADLS Gen2、HDInsight)。 **动手实验室** "AzureDataFactoryHOL-master"压缩包可能包含了完成本实验所需的所有资源和步骤,包括教程文档、示例数据、ADF配置文件等。通过这个动手实验,参与者将学习如何创建和部署ADF管道,配置各种活动,以及如何使用映射数据流进行数据转换。 总结起来,这个动手实验将涵盖Azure Data Factory的核心概念、关键功能和最佳实践,帮助你掌握如何利用ADF构建高效、安全和可扩展的数据集成解决方案。通过实际操作,你将加深对云数据工厂的理解,并提升你的数据工程技能。
2025-06-29 11:23:20 466.39MB azure hands-on-lab
1
这部书是一本以实践为主兼顾理论的机器学习好书,豆瓣高分,本电子书质量很好
2024-08-25 18:40:04 47.53MB TensorFlow Python
1