上传者: huashanskingmfk
|
上传时间: 2026-01-22 10:27:42
|
文件大小: 28KB
|
文件类型: MD
尚硅谷机器学习笔记总结涉及机器学习、深度学习的历史回顾,机器学习方法的分类,包括监督学习、无监督学习、强化学习和概率模型等。笔记详细介绍了机器学习的过程,从数据获取、数据清洗、特征工程到模型训练和模型部署。特征工程部分讨论了数据处理技术,如数据的增加、删除、转换(归一化、标准化)、过滤法(相关系数法、低方差过滤法)以及降维方法,如PCA。
在模型评估和模型选择方面,笔记深入探讨了损失函数的定义和应用,包括对0-1损失函数、平方损失函数、绝对值损失函数和对数似然损失函数的介绍。损失函数用于衡量模型预测误差大小,并在训练集和测试集上评价模型。此外,笔记还讲解了训练误差和测试误差的概念,并引入了经验误差最小化和泛化误差。笔记解释了欠拟合和过拟合的定义及其对模型泛化能力的影响,并讨论了正则化技术,包括L1正则化、L2正则化和ElasticNet正则化。交叉验证作为一种评估模型泛化能力的方法,详细介绍了简单交叉验证、K折交叉验证和留一交叉验证。
模型求解算法部分,笔记说明了解析法求解参数的原理和适用条件,包括线性回归推导。此外,笔记还包含了其他重要主题的讨论,如模型评估指标和模型选择方法。笔记内容丰富,涵盖了机器学习领域的多个关键知识点。