2006年IEEE数据挖掘国际会议选出的十个最具影响力的数据挖掘算法。由多位算法大牛筛选并完成此书。该书对初学人们十分有益。
2022-10-16 15:07:01 6.87MB IEEE 2006 数据挖局 算法
1
建模分析师(数据分析师、数据挖掘工程师) 理论基础:统计学、概率论、数理统计、多元统计分析、时间序列、数据挖掘(DM) 软件要求:Excel、SQL(必要)& SPSS Modeler、R、Python、SAS、Weka等(可选) 分析方法要求: 除掌握基本数据处理及分析方法以外,还应掌握高级数据分析及数据挖掘方法(多元线性回归法、生存分析法、神经网路、决策树、判别分析法、主成分分析法、因子分析法、典型相关分析、聚类分析法、关联规则、支持向量机、bagging、boosting等)和可视化技术。 业务分析能力: 可以将业务目标转化为数据分析目标 熟悉常用算法和数据结构,熟悉企业数据库架构建设 针对不同分析主体,可以熟练的进行维度分析,能够从海量数据中搜集并提取信息 通过相关数据分析方法,结合一个或多个数据分析软件完成对海量数据的处理和分析 结果展现能力: 报告体现数据挖掘的整体流程,层层阐述信息的收集、模型的构建、结果的验证和解读,对行业进行评估,优化和决策。
1