第2章 特征工程 2(自我学习集)
2.1. 数据集 2
2.1.1. 可用数据集 2
2.1.2. sklearn数据集 4
2.1.3. 数据集的划分 6
2.2. 特征工程介绍 7
2.2.1. 为什么需要特征工程(Feature Engineering) 8
2.2.2. 什么是特征工程 8
2.2.3. 特征工程的位置与数据处理的比较 8
2.3. 特征抽取 9
2.3.1. 特征提取 10
2.3.2. 字典特征提取 10
2.3.3. 文本特征提取 12
2.4. 特征预处理 20
2.4.1. 什么是特征预处理 20
2.4.2. 归一化 21
2.4.3. 标准化 24
2.5. 特征降维 26
2.5.1. 降维 27
2.5.2. 降维的两种方式 27
2.5.3. 什么是特征选择 28
2.6. 主成分分析 36
2.6.1. 什么是主成分分析(PCA) 36
2.6.2. 案例:探究用户对物品类别的喜好细分降维 40
2.7. 总结 42
2.8. 作业 43
2.9. END 44
1