干货课件,值得拥有,8个章节信息如下:
(1)数据挖掘概述
(2)数据预处理
(3)数据挖掘算法-分类与预测
(4)数据挖掘算法-聚类
(5)数据挖掘算法-关联分析
(6)序列模式挖掘
(7)数据挖掘软件
(8)数据挖掘应用
最后含一个示例:加热炉生产质量数据挖掘
挖掘步骤如下:
(1)样本抽取:
每加热一炉钢锭的生产历史数据记录为一组样本。
(2)数据挖掘步骤:
数据清洗:去除野值、数据平滑(移动平均)
模式抽取:所有样本各抽取10个特征模式
若用于质量预测:
主元分析:去除次要特征模式;
分类分析:建立质量分类模型(决策树);
若用于质量分析:
主元分析:去除次要特征模式;
相关分析:计算主要特征模式与钢锭内裂之间的相关度;
结果验证:用测试样本集对挖掘结果进行测试
结果输出:输出质量分类决策树或质量相关分析结果。