本书系统讲解基于基础模型构建AI应用的全流程,涵盖提示工程、检索增强生成(RAG)、代理系统、微调与数据工程等核心技术。结合真实案例与行业最佳实践,帮助开发者应对延迟、成本与幻觉等关键挑战,实现从原型到生产的高效落地。适合希望将生成式AI集成到产品中的工程师与技术决策者。 人工智能工程是一个将基础模型应用于构建复杂AI系统的专业领域。随着基础模型的出现,很多新的AI应用场景得以被开发,同时进入AI产品构建领域的门槛也大幅度降低。现在,即使是那些先前没有人工智能经验的人员,也能够使用这些基础模型来设计和实现AI应用。在AI工程领域,专业的工程师会研究AI构建应用的全流程,从选择合适的模型开始,到处理数据集,再到进行评估基准测试,最终把应用高效地部署到生产环境中。 在构建AI应用的过程中,开发者将面临各种挑战,比如如何优化AI应用的性能,如何控制成本和降低延迟等。为了应对这些挑战,开发者需要掌握多种技术,例如提示工程、检索增强生成技术(RAG)、代理系统以及模型微调和数据工程等。提示工程是通过优化指令来提高模型性能的一种技术;RAG技术结合了检索和生成模型,用于提升生成内容的准确性和相关性;代理系统通常指的是一种能够代表用户执行特定任务的软件系统;微调则是通过在特定数据集上训练模型,使其更好地适应特定任务的方法;数据工程关注于数据的处理、分析和维护,是确保AI系统能够获取高质量数据的关键步骤。 在本书中,作者Chip Huyen以她丰富的经验和深厚的专业知识,提供了一个全面的框架和一系列实用的工具,旨在帮助开发者在实践中解决实际问题。通过大量的真实案例分析和行业最佳实践的分享,AI工程实战指南将指导开发者如何有效地将生成式AI集成到产品中,实现从原型到生产的转化过程。 在实际开发过程中,AI应用开发者将不得不处理模型的泛化能力、数据集的质量和多样性、以及如何快速而准确地评估模型性能等一系列问题。本书将深入探讨这些问题,并提供实用的解决方案,使开发者能够更好地理解和应用AI技术。 本书不仅仅是一本关于AI构建的指南,它也向读者展示了如何在实际工程实践中应用基础模型来解决复杂的问题。它提供了一个全面的视角,帮助工程师和技术决策者理解AI工程的全貌,以及如何将生成式AI高效地集成到产品中。这本书将成为任何希望将AI技术规模化应用到企业中的专业人员的宝贵资源。
2026-02-25 17:29:43 64.7MB AI Engineering Finetuning
1
本文详细介绍了如何对Qwen3-8B模型进行微调,以训练中文古诗词赏析评测任务。首先,文章强调了环境配置的重要性,特别是CUDA12的安装和依赖库的版本匹配问题。其次,详细说明了数据准备的步骤,包括如何将原始JSON格式的数据转换为模型所需的格式,并提供了具体的Python脚本示例。接着,文章分享了微调过程中遇到的常见问题,如库版本不兼容、函数参数缺失等,并给出了相应的解决方案。最后,展示了模型运行的结果,为读者提供了完整的微调流程参考。 在进行Qwen3-8B模型微调之前,环境配置是最为基础且关键的一步。这涉及到确保系统的硬件和软件都能够满足模型训练的要求。特别是CUDA的安装和配置,需要细致处理,确保其版本与所用框架兼容,同时对于依赖库也需要进行精准的版本匹配。这一点对于减少在后续微调过程中遇到的技术障碍至关重要。 接着,对于数据的准备同样不可或缺。在这个过程中,数据的组织和格式化显得尤为重要,它直接决定了模型能否正确地读取和学习。文章中提到的数据转换步骤,即如何将原始的JSON格式数据处理成模型可以接受的格式,并提供了相关的Python脚本示例,对于实操者来说是一个难得的参考。通过这些步骤,数据被正确地准备,为模型提供了高质量的输入。 在微调模型时,往往会遇到各种预料之外的问题,如库版本不兼容或者函数参数不匹配等。这类问题若处理不当,将严重影响模型的训练效果和进度。文章中不仅列举了这些常见问题,并且给出了详实的解决策略,这对于新手或者有经验的研究者来说都具有极大的帮助。通过这些策略,微调过程中的难题得以迎刃而解,从而保证模型能够顺利进行训练。 最终,展示了模型训练的结果,这对于评估模型性能和微调效果至关重要。文章提供的这一部分资料,完整地呈现了从环境配置到数据处理,再到问题解决和模型结果展示的整个微调流程。这种详实的记录,不仅为研究者们提供了一个全面的微调参考,也为其他类似任务的执行者提供了宝贵的借鉴。 此外,通过这些经验分享,我们可以看到,成功地微调一个模型,不仅需要对模型本身的深入理解,还需要对整个开发和训练环境有充分的把控。从软硬件的准备,到数据预处理,再到问题解决,以及最终结果的评估,每一个环节都至关重要。这种系统化的处理方式,是实现模型微调成功的关键。 本文所分享的内容,涵盖了从环境配置到模型微调的全过程,不仅对中文古诗词赏析评测任务的训练具有指导意义,也为其他类似的深度学习任务提供了很好的实操范例。通过这样的指南,研究者和技术开发者们可以更高效地开展模型微调工作,从而推动人工智能技术在文化赏析等领域的应用和发展。
2026-02-25 15:09:43 5.26MB 软件开发 源码
1
《Acts用户指南3.1(中文版)》是关于ACTS测试生成工具的详细文档,主要面向使用该工具的IT专业人员。ACTS的核心功能在于构建t-way组合测试集,目前支持1到6的t范围,以检测由不同影响因素间意外相互作用引发的故障。工具提供了命令行和GUI两种接口。 1. **T-Way测试集生成**: - 这是ACTS的基础功能,用于创建测试集,确保系统中任意t个参数的所有值组合至少在一次测试中出现。当前,ACTS支持1到6-way的测试集生成。 - 基本选择测试是ACTS的一种特殊形式,要求每个参数值至少覆盖一次,且在其他值为基本选择的测试中存在。基本选择值通常是更重要的值,如默认值或最常用值。 2. **测试生成算法**: - ACTS支持多种算法,包括IPOG、IPOG-D、IPOG-F、IPOG-F2,以及基础选择。其中,IPOG和IPOG-F适用于中等规模系统,IPOG-D更适合大型系统。 - IPOG算法支持混合强度、约束和负面测试;IPOG-D则不支持混合强度、约束或负面测试;IPOG-F与IPOG类似,但支持负面测试;IPOG-F2不支持混合强度、约束或负面测试;基础选择算法仅针对强度1,支持约束和负面测试。 3. **综合实力**: - 此功能允许用户定义不同参数的组合强度,以反映参数间的交互性。用户可根据领域知识创建不同关系,覆盖不同强度的参数组合。 4. **约束支持**: - ACTS允许用户定义组合的有效性约束,以排除域语义中无效的组合,防止系统在执行这些组合时可能出现的问题或错误。 5. **负面测试**: - 负面测试用于验证系统对无效输入的处理,ACTS允许指定参数的无效值,并确保每个测试包含一个无效值,以避免掩蔽效应。目前,仅IPOG和IPOG-F支持t-way负测试。 6. **测试生成模式**: - ACTS提供"scratch"和"extend"两种模式。前者从零开始构建测试集,后者则允许扩展现有测试集,节省测试成本。 7. **命令行与GUI界面**: - 文档分别介绍了这两种接口的使用方法,帮助用户更有效地操作ACTS。 《Acts用户指南3.1(中文版)》为用户提供了全面的ACTS使用指导,涵盖了从基本概念到高级功能的各个层面,对于理解和应用ACTS进行高效测试具有重要价值。
2026-02-25 14:32:45 850KB 用户指南
1
PSCAD直流电网仿真研究:MMC变换器在500kV双端直流输电中的环流抑制与性能优化,基于MMC变换器的PSCAD直流电网仿真:500kV两端四端柔性直流输电与高压混合型直流断路器模型学习指南,PSCAD直流电网,基于MMC变器的柔性直流输电PSCAD仿真 500kV 2端 4端 200子模块,有环流抑制控制,子模块均压控制 还有500kV高压混合型直流断路器模型(DCCB) PSCAD EMTDC柔性直流输电学习必备 ,PSCAD直流电网; MMC变换器; 柔性直流输电仿真; 500kV; 2端4端; 环流抑制控制; 子模块均压控制; 500kV高压混合型直流断路器模型(DCCB); PSCAD EMTDC学习。,基于PSCAD的MMC变换器柔性直流输电仿真研究:500kV多端子模块均压控制与环流抑制
2026-02-24 14:15:57 1.65MB
1
本书系统介绍了几何代数(又称Clifford代数)在计算机科学与工程领域的实际应用。通过多位专家撰写的章节,涵盖刚体运动、插值跟踪、图像处理等主题,展示如何利用共形几何代数(CGA)统一表示几何对象与变换。书中强调结构保持的计算方法,将点、线、面、圆、球等几何元素与旋转、平移等运动操作无缝集成,提升计算效率与程序可读性。核心内容包括CGA的基本原理、对偶性、夹积表示运动、符号微分及稀疏化实现技术。附录提供自包含教程,帮助读者快速掌握关键概念。本书适合从事机器人、图形学、机器视觉等领域的研究人员与工程师,是连接抽象代数与实际问题的重要桥梁。
2026-02-24 12:34:43 15.52MB 几何代数 计算机科学 工程应用
1
基于LabVIEW 2018的多通道测振仪源代码解析与操作指南:支持IEPE传感器信号采集分析,高分辨率显示器体验优化,多通道振动数据采集与积分处理,多种格式数据导出及MATLAB分析集成。,基于LabVIEW 2018的多通道测振仪源代码:IEPE传感器信号采集与分析,支持多种NI设备,可设定采集参数并导出数据至TXT、Excel、MAT格式,细节波形可拖拽观察,基于LabVIEW 2018开发的多通道测振仪源代码,可对IEPE振动加速度传感器的信号进行采集分析。 为保证良好的体验性,建议选择显示器的分辨率为1920*1080,Windows的显示缩放比例为100%。 1.本程序仅支持NI数据采集机箱和NI声音与振动测量模块,数据采集机箱包括cDAQ,cRIO,PXI和PXIe系列,声音与振动模块参考NI官网 2.可支持最大6路加速度的采集,可自由设定采集通道路数。 3.每通道可积分成振动速度值,每个通道可以设置别名便于试验员观察分析 4.数据采集原始波形数据可以导出为TXT,Excel,MAT格式,MAT格式的文件可导入MATLAB分析 5.可设定数据采集速率和数据采集时间长度,可
2026-02-24 10:45:45 10.59MB rpc
1
内容概要:本文档详细介绍了将Qt与AutoCAD进行集成的具体步骤,涵盖从环境配置到最终打包的全过程。首先,它讲解了如何正确配置Visual Studio以支持Qt开发,包括设置附加包含目录和库目录,以及指定必要的依赖项。接着,针对AutoCAD的特殊需求,进一步扩展了配置,加入了ObjectARX的相关头文件和库文件路径。最后,提供了具体的打包命令,如使用windeployqt.exe来确保所有必需的DLL文件被正确复制到应用程序的执行路径下。此外,还展示了如何修改项目模板以适应特定的需求,比如更改输出文件扩展名为.arx,并移除_DEBUG宏定义。文中还包含了简单的Qt界面元素使用示例,如QMessageBox的消息框操作。 适合人群:熟悉C++编程语言并有一定Qt和AutoCAD使用经验的技术人员。 使用场景及目标:适用于需要将Qt图形界面嵌入到AutoCAD插件开发中的开发者,帮助他们快速搭建开发环境,掌握正确的打包流程,从而提高开发效率。 阅读建议:由于涉及到多个工具链和平台间的交互,建议读者在实际操作前仔细对照文档中的每一步骤,尤其是关于路径和版本号的部分,避免因小失大。同
2026-02-22 16:24:44 2KB AutoCAD ObjectARX windeployqt
1
**CORBA(Common Object Request Broker Architecture)中文版学习指南** CORBA,全称为“公共对象请求代理架构”,是一种中间件技术,旨在实现不同系统、不同编程语言间的对象间交互。它提供了一种标准的接口定义语言(IDL,Interface Definition Language),使得分布式的对象可以无视其底层实现,如同本地调用一样进行通信。这一技术在上世纪90年代得到了广泛应用,特别是在大型企业级分布式系统中。 **1. CORBA的核心概念** - **ORB(Object Request Broker)**: 对象请求代理是CORBA的核心组件,它负责对象间的通信。ORB使得对象能够透明地调用远程对象的方法,就像调用本地对象一样。 - **IDL(Interface Definition Language)**: IDL是CORBA用于定义接口的语言,类似于C++或Java的接口。通过IDL,开发者可以声明对象的操作、数据类型等,然后由编译器生成对应编程语言的代码。 - **GIOP(General Inter-ORB Protocol)**: GIOP是ORB之间通信的协议,它定义了ORB如何交换消息。 - **IIOP(Internet Inter-ORB Protocol)**: IIOP是GIOP在TCP/IP网络上的具体实现,它是CORBA的标准传输协议。 **2. CORBA的工作流程** 1. 客户端使用IDL定义服务接口,并生成客户端代理类。 2. 服务器端实现这些接口,并启动ORB。 3. 客户端启动ORB,通过定位服务(Naming Service)查找服务器对象。 4. ORB处理客户端的请求,通过IIOP将调用转发到服务器端的ORB。 5. 服务器端的ORB接收请求,执行相应操作,然后返回结果。 **3. CORBA的关键组件** - **IR(Interface Repository)**: 接口仓库存储所有的接口定义,供ORB和其他组件使用。 - **Naming Service**: 提供一个目录服务,帮助客户端找到服务器对象。 - **Trading Service**: 允许客户端动态发现和选择服务。 - **Event Service**: 支持发布/订阅模型,用于异步通信。 **4. CORBA的优势与挑战** 优势: - **跨平台**: CORBA标准支持多种操作系统和编程语言。 - **可扩展性**: 通过服务和接口的组合,可以构建复杂分布式系统。 - **透明性**: 对象间的交互对开发者透明,简化了分布式系统的开发。 挑战: - **复杂性**: CORBA的体系结构和配置相对复杂,学习曲线较陡峭。 - **性能**: 相比于更现代的技术如RESTful API,CORBA的通信开销可能较大。 - **生态系统**: 随着Web服务和微服务的流行,CORBA的应用场景逐渐减少。 **5. 学习资源** 对于初学者来说,《CORBA中文版学习指南》是一本很好的入门书籍,它应该会详细介绍CORBA的基本概念、组件、工作原理以及实际应用。同时,配合《中国IT认证实验室学习下载频道.txt》中的资料,可以深入理解并实践CORBA的相关知识。 在学习过程中,建议动手实践,例如编写简单的客户端和服务端程序,以加深理解。此外,还可以参考OMG(Object Management Group)的官方文档,它是CORBA标准的制定者,其文档详尽且权威。
2026-02-18 10:58:35 3.82MB CORBA
1
前言: 本文章穿插大量方法论+工作实例,融合5大方面(工作日常、项目管理、自我增进、领导力、沟通能力、团队合作), 14个高频工作场景下的软技能,其中融入大量作者个人经验总结,解决你99%的职场非coding难题,助力你打开软件开发职业生涯跃迁之门。 一、项目管理 项目管理是管理学的一个分支学科,对项目管理的定义是:指在项目活动中运用专门的知识、技能、工具和方法,使项目能够在有限资源限定条件下,实现或超过设定的需求和期望的过程。项目管理是对一些成功地达成一系列目标相关的活动(譬如任务)的整体监测和管控。这包括策划、进度计划和维护组成项目的活动的进展。 二、项目规模与多样性带来的管理难度 在当今的商业环境中,项目的规模和类型千差万别。大型项目往往涉及众多的参与方、复杂的流程和庞大的资源需求。例如,一个大型基础设施建设项目,可能需要协调多个设计团队、施工队伍、供应商以及政府部门。项目经理不仅要确保各个环节的顺利进行,还要处理好不同利益相关者之间的关系。
2026-02-18 09:16:21 3KB
1
内容概要:本文档《超详细!GitLab安装指南,小白也能轻松上手.pdf》详细介绍了GitLab的安装与配置流程。首先,解释了GitLab作为一个基于Git的代码管理平台,能有效管理开发过程中的代码和文档,提供版本控制、代码审查、多人协作等功能。接着,文档阐述了安装前的准备,包括环境要求(操作系统、硬件配置)和必备软件(Docker和Docker Compose)的安装步骤。然后,详细讲解了GitLab的安装过程,包括获取安装包、配置GitLab(如修改监听地址、端口号、数据库连接等)以及启动GitLab的具体操作。此外,文档还涵盖了初始化设置,如创建管理员账号、配置邮件通知和配置备份。最后,针对安装和使用过程中可能出现的问题,提供了详细的解决方法。 适合人群:适用于初学者和有一定基础的技术人员,特别是那些刚开始接触GitLab或有意向在其环境中部署GitLab的用户。 使用场景及目标:①帮助用户理解GitLab的功能和优势,提升代码管理能力;②指导用户顺利完成GitLab的安装与配置,确保其能够稳定运行;③通过配置邮件通知和备份,保障数据安全与系统可靠性;④解决安装和使用中遇到的常见问题,降低故障率。 阅读建议:本文档内容详尽,适合逐步学习和实践。建议读者在安装前仔细阅读每个步骤,并在实际操作中对照文档进行,特别是在配置文件修改和问题排查部分,注意细节,确保安装顺利。
2026-02-11 18:02:42 227KB GitLab 版本控制 Docker 安装指南
1